高度不平衡的Kademlia路由表

Question

高度不平衡的Kademlia路由表

9

在Kademlia论文的第2.4节的最后一段中，指出为了正确处理高度不平衡的树，Kademlia节点将所有有效联系人保留在至少包含k个节点的子树中，即使这需要分裂桶（bucket），其中节点自身ID不存在。

然而，论文的前一节似乎表明，如果k-bucket已经有k个元素，则对该k-bucket的任何进一步添加都需要删除最陈旧的节点（先ping它以查看其是否存活），否则将缓存该添加，直到k-bucket中有可用的插槽。

这篇论文似乎在这两点上存在矛盾。

在什么情况下应该拆分k-bucket？为什么？将“所有有效联系人”保存在路由表中似乎是不切实际的，因为路由表会很快变得非常大。该例子讨论了一个具有许多以001开头的节点和一个以000开头的节点的树。以000开头的节点将不得不不断地分裂其k-bucket，以便001能够容纳以001开头的每个有效节点？在160位地址空间中，这不会最终可能在000的路由表中存储2^157个节点吗？

引用块中的措辞也非常令人困惑...

“在一个子树中”--在路由表的哪个子树中？

“至少包含k个节点的子树”--我们使用什么指标来确定子树的大小？这里的节点是指Kademlia节点、k-buckets还是其他东西？

- offbynull

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- the8472 · Accepted Answer

然而，论文的前一部分似乎表明，如果一个k-bucket已经有k个元素，那么任何进一步添加到该k-bucket中的内容都需要删除最陈旧的节点（先ping它以查看其是否存活），或者在该k-bucket中的某个空槽位可用之前缓存该内容。这就是每当有节点联系要插入但该桶不符合拆分条件时维护桶的方法。

在什么情况下应该拆分k-bucket？为什么？

作为第一个近似值：每当无法插入新节点且桶的ID空间覆盖您的节点ID时，就拆分桶。这是为了在只对远程键空间部分有模糊意识的情况下保持对邻域的完全感知。即为了实现本地性。

为了涵盖不平衡树的情况 - 这可能发生在节点ID不是（伪）随机的情况下，或者至少在叶子桶中由于在随机分配时由于统计偶然性而导致的情况下 - 必须放松方法如下：

尝试在路由表中插入新联系人C
C所属的桶已满
C比您路由表中第K近的节点更接近您的节点ID，其中K是桶的大小

然后拆分桶。

实际上，这还需要进一步修改，以便在响应时使用松散的拆分，而不经请求应该只使用严格的拆分，否则在启动早期表尚未填充时，当松散的拆分发生时，您可能会得到一些奇怪扭曲的路由表。

当合并桶时，当路由表中没有更接近的节点时，由松散拆分创建的桶不会合并回单个非主桶中，这也需要考虑在内。

在S/Kademlia paper提出的改进之一是使用兄弟列表来跟踪节点的最近邻居，这可能比非本地分割更容易实现。