10得票3回答
如何将距离转换为概率?

有人能为我的Matlab程序提供帮助吗? 我有来自两个传感器的数据,我正在对它们分别进行kNN分类。 在这两种情况下,训练集看起来像是一组42行的向量,就像这样:[44 12 53 29 35 30 49; 54 36 58 30 38 24 37;..] 然后我得到一个样本,例如[40 ...

10得票1回答
使用sklearn-KNN进行预测,使用中位数(而不是平均值)

Sklearn-KNN允许在计算平均x个最近邻居时设置权重(例如,uniform,distance)。 是否可以使用中位数进行预测(可能需要使用用户定义的函数),而不是使用平均值?

10得票3回答
如何在k-最近邻算法中同时使用二进制和连续特征?

我的特征向量包含连续(或范围广泛)和二进制组件。如果我仅使用欧几里得距离,那么连续组件的影响将更大: 将对称和非对称表示为0和1,以及一些不太重要的比率从0到100变化,从对称变为非对称与比率增加25相比,距离影响微不足道。 我可以增加对称性的权重(例如通过将其设置为0或100),但是否有...

10得票2回答
kNN算法:训练、测试和验证

我正在从每个包含1000张图像的10个类别中提取图像特征。由于有50个要提取的特征,所以我考虑找到最佳的特征组合来使用。训练、验证和测试集被划分如下: Training set = 70% Validation set = 15% Test set = 15% 我在验证集上使用前向特征选...

10得票2回答
使用R获取KNN分类器的决策边界

我正在尝试使用ISLR包中的Auto数据集在R中拟合KNN模型并获得决策边界。 这里我遇到了一个难题,无法确定三类问题的决策边界。这是我目前的代码。但我没有得到决策边界。 我在这个网站的其他地方看到过使用ggplot解决这种问题的答案。但我想用plot函数来得到答案。 library(...

9得票1回答
调整Scikit-Learn KNN中的leaf_size以减少时间消耗

我是一名有用的助手,可以为您翻译文本。以下是需要翻译的内容: 我试图实现手写字符识别的KNN算法,但发现代码执行时间较长。当我添加了参数leaf_size并将其值设为400时,我观察到代码执行所需的时间显著减少。 原始代码: knn = KNeighborsClassifier(n_ne...

9得票3回答
Python中更快的kNN分类算法

我想从头开始编写自己的kNN算法,原因是我需要加权特征。问题是,尽管删除了for循环并使用内置的numpy功能,但我的程序仍然非常慢。 有人能建议一种加速的方法吗?我不使用np.sqrt来计算L2距离,因为这是不必要的,实际上会使速度变慢。 class GlobalWeightedKNN:...

9得票2回答
在Scikit-learn中,KNN分类器中的网格搜索参数和交叉验证数据集

我正在尝试使用SciKit-Learn执行我的第一个KNN分类器。我一直在遵循用户指南和其他在线示例,但有几件事我不确定。在此帖子中,让我们使用以下内容: X = 数据,Y = 目标 在我阅读的大多数机器学习入门页面中,似乎都说您需要训练集、验证集和测试集。从我的理解来看,交叉验证允许您...

9得票2回答
k-d树对于kNN搜索是否有效率?k个最近邻搜索

我需要在kd树中实现10维数据的k近邻搜索。 但问题是,我的算法对于k=1非常快,但是对于k>1(k=2,5,10,20,100)则慢了多达2000倍。 这种情况对于kd树来说正常吗?还是我做错了什么?

9得票4回答
有没有使用Matlab计算精确度和召回率的函数?

我在Matlab中使用kNN算法对包含150个数据点(50个Setosa,50个Versicolor,50个Virginica)的FisherIris数据进行分类,但是我在计算分类器的准确率和召回率时遇到了问题。下面是我的混淆矩阵: 50 0 0 0 48 2...