假设我有一个由n个向量组成的巨大列表(几百万个),给定一个新向量,我需要从该集合中找到一个相当接近的向量,但不一定是最接近的。(最近邻算法可以找到最接近的向量,但时间复杂度为n)
有哪些算法可以以很快的速度近似查找最近邻,但代价是准确性?
编辑:因为这可能会有所帮助,我应该提到数据大部分时间都很平滑,在随机维度上有小概率出现尖峰。
有哪些算法可以以很快的速度近似查找最近邻,但代价是准确性?
编辑:因为这可能会有所帮助,我应该提到数据大部分时间都很平滑,在随机维度上有小概率出现尖峰。
存在比O(n)更快的算法来通过任意距离搜索最接近的元素。详见http://en.wikipedia.org/wiki/Kd-tree。