18得票1回答
寻找K个最近邻居及其实现方式

我正在使用KNN和欧几里得距离对简单数据进行分类。我已经看到一个例子,展示了如何使用MATLAB的knnsearch函数来完成我想做的事情: load fisheriris x = meas(:,3:4); gscatter(x(:,1),x(:,2),species) newpoint ...

16得票5回答
SMOTE初始化期望n_neighbors <= n_samples,但n_samples < n_neighbors。

我已经预先清理了数据,以下显示前4行的格式: [IN] df.head() [OUT] Year cleaned 0 1909 acquaint hous receiv follow letter clerk crown... ...

15得票1回答
使用Python和Scikit Learn实现K-NN机器学习算法的ROC曲线

我目前正在尝试为我的kNN分类算法实现ROC曲线。我知道ROC曲线是真正率与假正率的绘图,但我很难从我的数据集中找到这些值。我将“autoimmune.csv”导入我的Python脚本并对其运行kNN算法以输出准确度值。Scikit-learn.org文档显示,要生成TPR和FPR,我需要传递...

15得票2回答
OCR算法改进

我正在使用Java创建一种基于OCR(Optical Character Recognition,光学字符识别)的技术。我的目标是从视频文件中提取文本(后处理)。 寻找一个纯Java的免费、开源OCR一直是一项艰巨的任务。我发现Tess4J是唯一流行的选择,但考虑到需要本地接口,我决定从头...

15得票3回答
KNN分类器数字识别前的预处理

目前,我正在使用OpenCV创建数字识别系统。在网上(甚至在StackOverflow上)有许多文章和示例。我决定使用KNN分类器,因为这个解决方案是WEB上最流行的。我发现了一个手写数字数据库,其中训练集包含60k个实例,误差率小于5%。 我使用这个教程作为如何使用OpenCV处理这个数据...

15得票2回答
PCA和KNN算法

我正在使用KNN算法对手写数字进行分类。现在我还实现了PCA来减少维度。从256维降到了200维,但我只发现大约损失了0.10%的信息。我删掉了56个维度,难道损失不应该更大吗?只有当我降到5个维度时,才会出现约20%的信息损失。这种情况正常吗?

14得票2回答
从距离矩阵开始,找到K个最近邻居

我正在寻找一个高度优化的函数,该函数接受一个 n X n 距离矩阵,并返回一个 n X k 矩阵,其中第i个数据点在第i行中具有前k个最近邻居的索引。 我发现有很多不同的R包可以让您执行KNN,但它们似乎都将距离计算与排序算法合并到同一个函数中。特别是对于大多数例程,主要参数是原始数据矩阵,...

14得票3回答
knn函数出现错误

我尝试运行这行代码:knn(mydades.training[,-7],mydades.test[,-7],mydades.training[,7],k=5) 但我总是得到这个错误:Error in knn(mydades.training[, -7], mydades.test[, -7],...

13得票2回答
为KNN设置特征权重

我正在使用sklearn实现的KNN算法。虽然我的输入数据有大约20个特征,但我认为其中一些特征比其他特征更重要。有没有一种方法可以在“训练”KNN学习器时为每个特征设置特征权重? 为每个特征设置特征权重,以便在“训练”KNN学习器时使用。 在预处理数据与否的情况下了解最佳权重值是什么。...

13得票4回答
Python中的K最近邻算法

我想在Python中计算K最近邻居算法,应该使用哪个库?