10得票3回答
如何在k-最近邻算法中同时使用二进制和连续特征?

我的特征向量包含连续(或范围广泛)和二进制组件。如果我仅使用欧几里得距离,那么连续组件的影响将更大: 将对称和非对称表示为0和1,以及一些不太重要的比率从0到100变化,从对称变为非对称与比率增加25相比,距离影响微不足道。 我可以增加对称性的权重(例如通过将其设置为0或100),但是否有...

9得票3回答
K最近邻居C/C++实现

我想知道在哪里可以找到k最近邻算法的串行C/C++实现? 你是否知道有哪个库具有这个功能? 我已经找到了openCV,但是它的实现已经是并行的。 我想从串行实现开始,并使用pthread、openMP和MPI进行并行化。 谢谢, Alex

29得票2回答
使用scikit learn KNeighborsClassifier的余弦距离

能否使用类似于1 - 余弦相似度的方法来使用scikit learn的KNeighborsClassifier? 这个回答说不行,但是在KNeighborsClassifier文档中,提到了DistanceMetrics中提到的度量标准是可用的。距离度量标准并不包括显式的余弦距离,可能是因为它...

10得票2回答
kNN算法:训练、测试和验证

我正在从每个包含1000张图像的10个类别中提取图像特征。由于有50个要提取的特征,所以我考虑找到最佳的特征组合来使用。训练、验证和测试集被划分如下: Training set = 70% Validation set = 15% Test set = 15% 我在验证集上使用前向特征选...

21得票4回答
Python中使用KNN进行缺失值插补

我有一个数据集,长这样 1908 January 5.0 -1.4 1908 February 7.3 1.9 1908 March 6.2 0.3 1908 April NaN 2.1 1908 May NaN 7.7 1908 J...

10得票1回答
使用sklearn-KNN进行预测,使用中位数(而不是平均值)

Sklearn-KNN允许在计算平均x个最近邻居时设置权重(例如,uniform,distance)。 是否可以使用中位数进行预测(可能需要使用用户定义的函数),而不是使用平均值?

23得票1回答
使用OpenCV 3.0中的cv2训练KNN模型

我正在尝试使用cv2(Python 2.7)和OpenCV 3.0运行k最近邻。我已经复制了类似http://docs.opencv.org/3.0-beta/doc/py_tutorials/py_ml/py_knn/py_knn_understanding/py_knn_understan...

14得票2回答
从距离矩阵开始,找到K个最近邻居

我正在寻找一个高度优化的函数,该函数接受一个 n X n 距离矩阵,并返回一个 n X k 矩阵,其中第i个数据点在第i行中具有前k个最近邻居的索引。 我发现有很多不同的R包可以让您执行KNN,但它们似乎都将距离计算与排序算法合并到同一个函数中。特别是对于大多数例程,主要参数是原始数据矩阵,...

10得票3回答
如何将距离转换为概率?

有人能为我的Matlab程序提供帮助吗? 我有来自两个传感器的数据,我正在对它们分别进行kNN分类。 在这两种情况下,训练集看起来像是一组42行的向量,就像这样:[44 12 53 29 35 30 49; 54 36 58 30 38 24 37;..] 然后我得到一个样本,例如[40 ...

16得票5回答
SMOTE初始化期望n_neighbors <= n_samples,但n_samples < n_neighbors。

我已经预先清理了数据,以下显示前4行的格式: [IN] df.head() [OUT] Year cleaned 0 1909 acquaint hous receiv follow letter clerk crown... ...