Trie树与B+树的比较

Question

19

Trie和B+树在对按字典顺序排序的字符串进行索引时有何区别[涉及数十亿个元素]？它们都应该支持范围查询。从性能和实现复杂度角度来看，两者如何比较？

- Fakrudeen

3个回答

4

根据您实际的任务：

- Denis Bazhenov

我使用的一些trie的变体不仅比B树更节省空间，而且对于大多数查询（直接访问、单词完成、范围查询）也更快。 - Mathieu Rodic

-1

维基百科有一些算法复杂性的事实：B+树（特征部分），Trie（不幸的是分散在整篇文章中）。希望这可以帮到你。

- thSoft

请在回答中包含相关事实。简单地链接到维基百科并不有用。 - Yakov Galka

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Matthieu M. · Accepted Answer

我会说这取决于您所说的"范围(Range)"的含义。

如果您的范围是以"所有以...开头的单词(All words beginning by)"为表达方式，那么我认为使用Trie是正确的选择。另一方面，Trie不适用于像"介于XX和ZZ之间的所有单词(All words between XX and ZZ)"这样的请求。

请注意，B+树(B+ Tree)的分支因子会影响其性能(中间节点的数量)。如果h是树的高度，则n_max ~~ b^h。因此，h ~~ log(n_max) / log(b)。

对于n = 1 000 000 000和b = 100，我们有h ~~ 5。因此，这意味着从根到叶子只需要进行5次指针解引用操作。它比Trie更适合缓存。

最后，B+树(B+ Tree)的实现难度确实比Trie大：它更接近于红黑树(Red-Black Tree)的复杂度。