我猜测这个问题可能有些开放式,但我很想知道当网络搜索引擎索引网页时,哈希是如何工作的。有哪些常见的哈希码被用于此目的?
针对Sphinx搜索引擎,它是一个非常流行的开源产品,与Lucene相媲美,使用的哈希函数是CRC。它将索引文档中找到的每个单词转换为32位/64位整数,使用的是CRC。