最近邻 - 局部敏感哈希的缺点

3

局部敏感哈希似乎是一种对KNN来说没有任何缺点的伟大技术。然而,在实际应用中使用局部敏感哈希的缺点是什么?在什么情况下,LSH会失败或表现不佳?还是编码/调整需要很长时间?


1
不确定这是否是适合讨论的论坛。stackoverflow 专注于回答具体的技术问题。 - user1023602
有没有好的论文? - user3085931
@jonty rhodes,我已经回答了你的问题! - gsamaras
1个回答

2

这是一个比较宽泛的问题,但由于您是新来的,我将尝试回答。

LSH并不像您描述的那样完美,当然,请搜索相关论文。也许这个问题可以帮助您:如何理解局部敏感哈希?

有很多提供自动参数配置的LSH库,但对于最重要的一个R,用于解决随机R近邻的版本,则没有。这是一个主要的缺点,因为用户必须手动在每次输入时识别R 。在实际应用中,这是一个非常重要的方面需要考虑。

关于性能,一切取决于您的输入!例如,在我的kd-GeRaF项目中,我彻底测试了LSH,并发现在准确性和搜索速度方面可能存在一些重要问题。数据集的范围在高维空间中进行ANNS。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接