boost::hash_combine
模板函数接受一个指向哈希(称为seed
)和一个对象v
的引用。根据文档,它通过以下方式将seed
与v
的哈希组合起来:
seed ^= hash_value(v) + 0x9e3779b9 + (seed << 6) + (seed >> 2);
我可以看出这是确定性的。我明白为什么要使用异或操作。
我猜加法有助于将类似的值映射到远离彼此的位置,这样探测哈希表就不会崩溃,但是有人能解释一下魔术常数是什么吗?
boost::hash_combine
模板函数接受一个指向哈希(称为seed
)和一个对象v
的引用。根据文档,它通过以下方式将seed
与v
的哈希组合起来:
seed ^= hash_value(v) + 0x9e3779b9 + (seed << 6) + (seed >> 2);
我可以看出这是确定性的。我明白为什么要使用异或操作。
我猜加法有助于将类似的值映射到远离彼此的位置,这样探测哈希表就不会崩溃,但是有人能解释一下魔术常数是什么吗?
魔数应该是32个随机位,每个位都有同样的概率是0或1,并且位之间没有简单的相关性。找到这样一串位的常见方法是使用一个无理数的二进制展开;在这种情况下,该数字是黄金比例的倒数:
phi = (1 + sqrt(5)) / 2
2^32 / phi = 0x9e3779b9
所以,包含这个数字会“随机”地改变种子的每一位;正如你所说,这意味着连续的值将会相距很远。包括旧种子的移位版本可以确保即使hash_value()
具有相当小的值范围,差异也很快会在所有位上分散开来。
0x9e3779b97f4a7800
,效果会更好。 - Barry0x9e3779b97f4a7c15
。 - kennytm请看1997年Bob Jenkins在DDJ杂志上发表的文章《关于哈希函数》。其中所解释的“黄金比例”(magic constant)如下:
黄金比例确实是一个任意值。它的作用是避免将所有零映射到所有零。
使用Python获取这个神奇数字:
from math import sqrt
phi = (1 + sqrt(5)) / 2
hex(int(2**32/phi))