464得票8回答
在R中进行聚类分析:确定最佳聚类数

我如何选择最佳的聚类数来进行k-means分析?在绘制下面数据子集之后,应该选择多少个聚类为适宜?我如何执行聚类树形图分析?n = 1000 kk = 10 x1 = runif(kk) y1 = runif(kk) z1 = runif(kk) x4 = sample(x1,...

231得票10回答
199得票20回答
数据挖掘中分类和聚类的区别是什么?

请问有人能够解释数据挖掘中分类和聚类的区别吗? 如果可以的话,请提供分类和聚类的例子以便理解主要思想。

154得票20回答
当使用k-means聚类时,我该如何确定k值?

我一直在学习k-means聚类,但有一件事不太清楚,那就是如何选择k的值。这仅仅是试错还是还有其他因素呢?

120得票8回答
什么是期望最大化算法的直观解释?

期望最大化算法(Expectation Maximization,简称EM)是一种用于分类数据的概率方法。如果它不属于分类器,请纠正我。 这个EM技术的直观解释是什么?这里的“期望”是什么,什么被“最大化”了?

110得票6回答
1D 数组聚类

假设我有一个像这样的数组:[1,1,2,3,10,11,13,67,71] 有没有一种方便的方法将数组分成像这样的东西?[[1,1,2,3],[10,11,13],[67,71]] 我查看了类似的问题,大多数人建议使用k-means对点进行聚类,例如像scipy这样的工具,但对于像我这样的初学...

99得票7回答
无监督聚类及未知簇数

我有一组大量的三维向量。 我需要根据欧几里得距离将它们聚类,使得任何特定簇中的所有向量彼此之间的欧几里德距离小于阈值“T”。 我不知道存在多少个簇。最后可能存在单独的向量,因为它与空间中的任何向量的欧几里德距离都不小于“T”,而不属于任何簇。 应该使用哪些现有算法/方法?

59得票18回答
K-means算法的变体,具有等大小簇的特点。

我正在寻找一种最快的算法,将地图上的点按距离平均分组。k-means clustering algorithm 看起来直接且有前途,但无法产生大小相等的组。 是否有这个算法的变体或其他算法可实现所有聚类中成员数量相等? 参见:Group n points in k clusters of...

55得票2回答
在数据矩阵之上绘制层次聚类结果的图表

我该如何在Python中将一个树状图绘制在一个值矩阵的顶部,并适当重新排序以反映聚类? 以下是一个示例图: 这是来自文章《黑猩猩诱导多能干细胞的组成:比较功能基因组学资源》的第6张图片。 我使用scipy.cluster.dendrogram制作我的树状图并对数据矩阵执行分层聚类。然后...

54得票3回答
Scikit Learn - K-Means - Elbow - criterion

今天我正在尝试学习关于K-means的一些东西。我已经理解了算法并知道它如何工作。现在我正在寻找正确的k值...我发现肘部准则是一种检测正确k值的方法,但我不知道如何在scikit learn中使用它?!在scikit learn中,我是用这种方式对事物进行聚类kmeans = KMeans(...