如何在不使用查找表情况下,最快地计算一个 UInt32
中设置为1的位数(即计算1的数量)?是否有一种可以在 O(1)
的时间内进行计数的方法?
这个位运算技巧页面提供了多种解决方案。
当然,你可以争论对所有32个可能的位进行迭代是 O(N),因为每次的成本都相同 :)
为了简单起见,我会考虑每字节查找表的方法,或者是Brian Kernighan的巧妙想法,该想法迭代与设置的位数相同次数,我的写法如下:
public static int CountBits(uint value)
{
int count = 0;
while (value != 0)
{
count++;
value &= value - 1;
}
return count;
}
如果您不喜欢填充256个条目的查找表的想法,每半字节进行一次查找仍然非常快。请注意,8个数组查找可能比32个简单位操作慢。
当然,在采用特别深奥的方法之前,测试您的应用程序的实际性能是值得的...这对您来说真的是瓶颈吗?
var power = IPAddress.Parse("255.255.240.0").GetAddressBytes().Select(b => b.InverseBits()).CountSetBits(); var addressesInNetwork = Math.Pow(2, power);
- Janis Veinbergsvar isPowerOf2 = (CountBits(input) == 1 && input>0);
。 - to11mtm这是一个重复的问题: how-to-implement-bitcount-using-only-bitwise-operators 或者 best-algorithm-to-count-the-number-of-set-bits-in-a-32-bit-integer
而且有许多解决方案。我使用的是:
int NumberOfSetBits(int i)
{
i = i - ((i >> 1) & 0x55555555);
i = (i & 0x33333333) + ((i >> 2) & 0x33333333);
return (((i + (i >> 4)) & 0x0F0F0F0F) * 0x01010101) >> 24;
}
popcnt
内部函数已经暴露出来,允许您对uint或uint64执行单指令种群计数计算。int setBits = System.Runtime.Intrinsics.X86.Popcnt.PopCount(value);
还有一个64位版本的System.Runtime.Intrinsics.X86.Popcnt.X64.PopCount()
,可以在64位CPU上使用,用于ulong
。
List
对象。更快的方法是像John Skeet上面提到的那样将数字拆分成块,以便您可以使用查找表。我在这里进行了调查,并显示它通常比每次计算位置要快。 - Polynomial在核心 3.0 及以上版本中提供了一个平台无关的BitOperations.PopCount
。
当硬件内部函数可用时,它将使用硬件内部函数;否则,它将默认使用软件回退。目前支持 X86/64 和 ARM 处理器。
感谢 @Mark 在另一个答案的评论中提到此事。
https://learn.microsoft.com/en-us/dotnet/api/system.int32.popcount
import java.util.*;
public class HelloWorld {
static int setBits(int n) {
int count = 0;
while(n != 0) {
count+= ((n & 1) == 1) ? 1 : 0;
n >>= 1;
}
return count;
}
public static void main(String []args){
Scanner sc = new Scanner(System.in);
int n = sc.nextInt();
System.out.println("Results: " + HelloWorld.setBits(n));
}
}