我想使用LSH构建一个具有数百万个高维向量的大型可扩展数据库。由于我必须将所有数据保存在内存中以实现快速查询,因此必须将数据分布到多个服务器上以容纳所有对象。
一种天真的方法是将所有对象分散到不同的服务器上,并向每个服务器发送一个查询。具有最佳答案的服务器应该有正确的对象。
我相信一定有更好的解决方案,其中一个查询不必发送到所有服务器节点,并且类似的对象在一个服务器上分组。
对于分布式LSH表,什么是好的方法?也许有一些项目?
感谢任何提示。
一种天真的方法是将所有对象分散到不同的服务器上,并向每个服务器发送一个查询。具有最佳答案的服务器应该有正确的对象。
我相信一定有更好的解决方案,其中一个查询不必发送到所有服务器节点,并且类似的对象在一个服务器上分组。
对于分布式LSH表,什么是好的方法?也许有一些项目?
感谢任何提示。