464得票8回答
在R中进行聚类分析:确定最佳聚类数

我如何选择最佳的聚类数来进行k-means分析?在绘制下面数据子集之后,应该选择多少个聚类为适宜?我如何执行聚类树形图分析?n = 1000 kk = 10 x1 = runif(kk) y1 = runif(kk) z1 = runif(kk) x4 = sample(x1,...

231得票10回答
154得票20回答
当使用k-means聚类时,我该如何确定k值?

我一直在学习k-means聚类,但有一件事不太清楚,那就是如何选择k的值。这仅仅是试错还是还有其他因素呢?

118得票3回答
scikit-learn会利用GPU吗?

阅读在TensorFlow中实现scikit-learn:http://learningtensorflow.com/lesson6/和 scikit-learn:http://scikit-learn.org/stable/modules/generated/sklearn.cluster....

59得票18回答
K-means算法的变体,具有等大小簇的特点。

我正在寻找一种最快的算法,将地图上的点按距离平均分组。k-means clustering algorithm 看起来直接且有前途,但无法产生大小相等的组。 是否有这个算法的变体或其他算法可实现所有聚类中成员数量相等? 参见:Group n points in k clusters of...

54得票3回答
Scikit Learn - K-Means - Elbow - criterion

今天我正在尝试学习关于K-means的一些东西。我已经理解了算法并知道它如何工作。现在我正在寻找正确的k值...我发现肘部准则是一种检测正确k值的方法,但我不知道如何在scikit learn中使用它?!在scikit learn中,我是用这种方式对事物进行聚类kmeans = KMeans(...

50得票6回答
如何获取每个簇中的样本?

我正在使用sklearn.cluster KMeans包。当我完成聚类后,如果我需要知道哪些值被分组在一起,我该如何做? 比如说我有100个数据点,KMeans给了我5个簇。现在我想知道哪些数据点在第5个簇中,我该怎么办。 是否有一个函数可以给出簇的id并列出该簇中的所有数据点?

49得票8回答
Python k-means算法

我正在寻找使用 Python 实现 k-means 算法的示例,以对我的坐标数据库进行聚类和缓存。

48得票3回答
k-means聚类后为新数据分配簇的简单方法

我正在对数据框df1进行k-means聚类,并寻找一种简单的方法来计算新数据框df2中每个观测值的最近簇中心。把df1看作训练集,df2看作测试集;我想在训练集上进行聚类,并将每个测试点分配到正确的簇。 我知道如何使用apply函数和一些简单的用户自定义函数来实现这一点(关于这个主题的以前的...

46得票4回答
Kmeans: Quick-TRANSer阶段步骤超过最大限制。

我正在使用标准的stats包在具有636,688行和7列的数据集上运行R中的k-means聚类:kmeans(dataset,centers = 100,nstart = 25,iter.max = 20)。 我遇到了以下错误:Quick-TRANSfer stage steps excee...