得票数最多 'cluster-analysis' 问题

假设我有一个像这样的数组：[1,1,2,3,10,11,13,67,71] 有没有一种方便的方法将数组分成像这样的东西？[[1,1,2,3],[10,11,13],[67,71]] 我查看了类似的问题，大多数人建议使用k-means对点进行聚类，例如像scipy这样的工具，但对于像我这样的初学...

arrayscluster-analysisdata-miningdimensionpartition-problem

99得票7回答

无监督聚类及未知簇数

我有一组大量的三维向量。我需要根据欧几里得距离将它们聚类，使得任何特定簇中的所有向量彼此之间的欧几里德距离小于阈值“T”。我不知道存在多少个簇。最后可能存在单独的向量，因为它与空间中的任何向量的欧几里德距离都不小于“T”，而不属于任何簇。应该使用哪些现有算法/方法？

algorithmmathartificial-intelligencemachine-learningcluster-analysis

59得票18回答

K-means算法的变体，具有等大小簇的特点。

我正在寻找一种最快的算法，将地图上的点按距离平均分组。k-means clustering algorithm 看起来直接且有前途，但无法产生大小相等的组。是否有这个算法的变体或其他算法可实现所有聚类中成员数量相等？参见：Group n points in k clusters of...

algorithmdictionarycluster-analysisk-means

55得票2回答

在数据矩阵之上绘制层次聚类结果的图表

我该如何在Python中将一个树状图绘制在一个值矩阵的顶部，并适当重新排序以反映聚类？以下是一个示例图：这是来自文章《黑猩猩诱导多能干细胞的组成：比较功能基因组学资源》的第6张图片。我使用scipy.cluster.dendrogram制作我的树状图并对数据矩阵执行分层聚类。然后...

pythonmatplotlibscipycluster-analysisdendrogram

54得票3回答

Scikit Learn - K-Means - Elbow - criterion

今天我正在尝试学习关于K-means的一些东西。我已经理解了算法并知道它如何工作。现在我正在寻找正确的k值...我发现肘部准则是一种检测正确k值的方法，但我不知道如何在scikit learn中使用它？！在scikit learn中，我是用这种方式对事物进行聚类kmeans = KMeans(...

pythonmachine-learningscikit-learncluster-analysisk-means