假设我们有一个相互连接的大型数据库图,实际上是一个巨大的分布式数据库。图上的任何节点都可以通过递归查询其邻居来查询整个数据库,邻居会将它们从邻居处获取的结果组合后向下传递查询路径。
此外,假设有能力停止递归,如果节点自己的数据库包含“足够好”的结果,则不必查询整个网络,因此如果附近已经有不错的结果,则我即将说的内容就很相关了。
每次进行查询时,将返回的数据向更接近发起查询的节点转移一步,这样做是否有意义?也就是说,被查询的节点查询其邻居并获得X,查询自身并获得Y,将X+Y传回查询它的节点,将X存储在其数据库中,并从其数据库中删除Y。这样做是否最终会导致分布式数据库在节点之间具有大致最优的数据分布,平均而言,在查询期间将被查询的节点数量?
这种技术有名称吗?
此外,假设有能力停止递归,如果节点自己的数据库包含“足够好”的结果,则不必查询整个网络,因此如果附近已经有不错的结果,则我即将说的内容就很相关了。
每次进行查询时,将返回的数据向更接近发起查询的节点转移一步,这样做是否有意义?也就是说,被查询的节点查询其邻居并获得X,查询自身并获得Y,将X+Y传回查询它的节点,将X存储在其数据库中,并从其数据库中删除Y。这样做是否最终会导致分布式数据库在节点之间具有大致最优的数据分布,平均而言,在查询期间将被查询的节点数量?
这种技术有名称吗?