7得票3回答
处理kNN中的不完整数据(数据稀疏性)

我正在尝试使用knn创建一个简单的推荐系统。 假设我有一个表格: User | Book1 | Book2 | Book3 | Book4 | Book5 | Book6 | Book7 | 1 | 5 | ? | 3 | ? | 4 | 3 ...

29得票2回答
使用scikit learn KNeighborsClassifier的余弦距离

能否使用类似于1 - 余弦相似度的方法来使用scikit learn的KNeighborsClassifier? 这个回答说不行,但是在KNeighborsClassifier文档中,提到了DistanceMetrics中提到的度量标准是可用的。距离度量标准并不包括显式的余弦距离,可能是因为它...

11得票3回答
如何在Python中使用kNN和动态时间规整(Dynamic Time Warping)

我有一个带有两个标签(0和1)的时间序列数据集。我正在使用动态时间规整(DTW)作为相似性度量,使用k近邻(kNN)进行分类,这在这两篇精彩的博客文章中有所描述: https://nbviewer.jupyter.org/github/markdregan/K-Nearest-Neighb...

15得票3回答
KNN分类器数字识别前的预处理

目前,我正在使用OpenCV创建数字识别系统。在网上(甚至在StackOverflow上)有许多文章和示例。我决定使用KNN分类器,因为这个解决方案是WEB上最流行的。我发现了一个手写数字数据库,其中训练集包含60k个实例,误差率小于5%。 我使用这个教程作为如何使用OpenCV处理这个数据...

9得票4回答
有没有使用Matlab计算精确度和召回率的函数?

我在Matlab中使用kNN算法对包含150个数据点(50个Setosa,50个Versicolor,50个Virginica)的FisherIris数据进行分类,但是我在计算分类器的准确率和召回率时遇到了问题。下面是我的混淆矩阵: 50 0 0 0 48 2...

32得票3回答
使用Sklearn kNN算法和用户定义的度量标准

目前我正在进行一个项目,可能需要使用kNN算法来查找给定点P的前k个最近邻居,我正在使用Python的sklearn包来完成这项工作,但我们预定义的度量标准不是默认值之一。所以我必须使用用户定义的度量标准。根据sklearn文档,可以在这里和这里找到。 最新版本的sklearn kNN似乎支...

16得票5回答
SMOTE初始化期望n_neighbors <= n_samples,但n_samples < n_neighbors。

我已经预先清理了数据,以下显示前4行的格式: [IN] df.head() [OUT] Year cleaned 0 1909 acquaint hous receiv follow letter clerk crown... ...

23得票1回答
使用OpenCV 3.0中的cv2训练KNN模型

我正在尝试使用cv2(Python 2.7)和OpenCV 3.0运行k最近邻。我已经复制了类似http://docs.opencv.org/3.0-beta/doc/py_tutorials/py_ml/py_knn/py_knn_understanding/py_knn_understan...

11得票1回答
增加n_jobs对GridSearchCV没有影响。

我设置了一个简单的实验,以检查在运行带有KNeighborsClassifier的GridSearchCV时,多核CPU的重要性。我得到的结果让我感到惊讶,我想知道我是否误解了多核的好处,或者我没有做好。 使用2-8个作业完成所需的时间没有任何区别。怎么会这样?我注意到了CPU性能选项卡上...

9得票3回答
K最近邻居C/C++实现

我想知道在哪里可以找到k最近邻算法的串行C/C++实现? 你是否知道有哪个库具有这个功能? 我已经找到了openCV,但是它的实现已经是并行的。 我想从串行实现开始,并使用pthread、openMP和MPI进行并行化。 谢谢, Alex