184得票15回答
高维数据中的最近邻居?

我在几天前发了一个问题,询问如何找到给定向量的最近邻。我的向量现在有21个维度,然而由于我不是机器学习或数学领域的人,所以在进一步进行之前,我开始思考一些基本问题: 欧氏距离是否是首选用于寻找最近邻的良好度量方式?如果不是,我该选择什么方法? 此外,如何确定确定k个最近邻的正确阈值?是否有...

159得票6回答
如何理解局部敏感哈希?

我注意到LSH似乎是一种寻找高维属性相似项的好方法。 在阅读了http://www.slaney.org/malcolm/yahoo/Slaney2008-LSHTutorial.pdf这篇论文之后,我仍然对其中的公式感到困惑。 是否有人知道一篇博客或文章可以用简单的方式解释LSH?

74得票5回答
如何通过索引列表筛选numpy数组?

我有一个由LAS数据 [x,y,z,intensity,classification] 组成的numpy数组filtered__rows。 我创建了一个点的cKDTree并找到了最近的邻居 query_ball_point,它是点及其邻居的索引列表。 有没有办法过滤filtered__rows...

71得票12回答
数百万个三维点:如何找到离给定点最近的十个点?

一个3D点由(x,y,z)定义。 任意两个点(X,Y,Z)和(x,y,z)之间的距离是d= Sqrt [(X-x)^2 +(Y-y)^2 +(Z-z)^2]。 现在有一个包含一百万个条目的文件,每个条目都是空间中的一些点,没有特定顺序。 给定任何点(a,b,c),找到离它最近的10个点。 您将...

47得票4回答
在这个最近邻算法中,“from distinct vertex chains”的意思是什么?

以下伪代码摘自The Algorithm Design Manual在线预览版的第一章(来自此PDF的第7页)。 该示例是一个有缺陷的算法,但我仍然想要理解它: [...] 另一个想法可能是重复连接最接近的一对端点,其连接不会创建问题,例如循环过早终止。每个顶点都作为自己的单个顶点链开始。...

31得票2回答
最近邻搜索:Python

我有一个二维数组:MyArray = array([6588252.24, 1933573.3, 212.79, 0, 0], [6588253.79, 1933602.89, 212.66, 0, 0], etc...) My...

23得票3回答
在Python上实现迭代最近点(ICP)算法

最近我一直在寻找Python中实现ICP算法的方法,但是没有结果。 根据维基百科文章http://en.wikipedia.org/wiki/Iterative_closest_point,该算法的步骤如下: 使用最近邻准则将点关联起来(对于第一个点云中的每个点,找到第二个点云中最接近的...

21得票3回答
Chrome/Safari中的图像插值模式是什么?

我需要使用最近邻插值方式进行图像缩放,而不是当前使用的双三次插值方式。目前我使用以下代码:ms-interpolation-mode: nearest-neighbor; image-rendering: -moz-crisp-edges; 这在IE和Firefox中有效,但在Chrome和S...

21得票6回答
如何高效地在高维数据中找到k个最近邻居?

我有大约16,000个75维数据点,对于每个点,我想找到它的k个最近邻居(使用欧几里得距离,目前k=2以使问题简化)。 我的第一个想法是使用kd树实现,但是随着维数增长,它们变得相当低效。在我的示例实现中,它只比穷举搜索略快一些。 我的下一个想法是使用PCA(主成分分析)来减少维数,但我想...

20得票4回答
MATLAB中的最近邻插值算法

我正在尝试编写自己的函数,使用最近邻插值算法对输入图像进行放大。糟糕的是,我能够看到它的工作原理,但找不到算法本身。非常感谢任何帮助。 以下是我尝试过的将输入图像放大两倍的方法:function output = nearest(input) [x,y]=size(input); outpu...