16得票1回答
使用平滑器和L方法确定K-Means聚类的数量

有人尝试在应用L方法确定数据集中k-means簇数之前,将平滑器应用于评估指标吗?如果是这样,结果是否得到了改善?或者允许更少的k-means试验,从而大大增加速度?您使用了哪种平滑算法/方法? L方法详见:确定分层聚类/分割算法中簇/段数的方法,Salvador & Chan 该...

15得票1回答
SOM(自组织映射)和K-Means有什么区别?

在stackoverflow上只有一个与此相关的问题,而且更多是关于哪个更好的问题。我只是真的不太理解它们之间的区别。我的意思是,它们都使用向量,这些向量随机分配给簇,它们都使用不同簇的质心来确定获胜输出节点。我的意思是,它们之间到底有什么区别?

15得票8回答
K-means空聚类

我尝试实现k-means作为一项家庭作业。我的练习册在空心中心方面给了我以下备注: 迭代过程中,如果任何一个聚类中心没有与之相关联的数据点,请使用随机数据点替换它。 这让我有些困惑,首先我阅读的维基百科或其他来源都没有提到这一点。我进一步阅读了有关“选择适合您数据的好k”的问题 -...

14得票1回答
k-means算法中使用选定的初始中心点

我正在尝试使用选定的初始质心进行k-means聚类。这里说明说,要指定您的初始中心:init : {‘k-means++’, ‘random’ or an ndarray} 如果传递了一个ndarray,它应该是形状为(n_clusters, n_features)的数组,并给出初始中心点。...

14得票1回答
如何在R中指定kmeans算法的距离度量方式?

我正在使用R进行kmeans聚类,并有两个要求: 我需要指定自己的距离函数,现在是皮尔逊系数。 我想要进行聚类,使用组成员的平均值作为质心,而不是实际的成员。 这个要求的原因是,我认为使用平均值作为质心比使用实际成员更有意义,因为成员通常不接近真正的质心。如果我对此有误,请纠正我。 首...

14得票1回答
如何使用KMeans算法查找在同一簇中的文档

我已经使用Scikit-learn框架将各种文章进行了聚类。下面是每个聚类中排名前15的单词:Cluster 0: whales islands seaworld hurricane whale odile storm tropical kph mph pacific mexico orca ...

14得票4回答
在Java中读取wav文件

我想在Java中读取wav文件,并使用K-means算法进行分类。 如何在Java中读取wav文件并将它们分配到一个数组或类似的结构中(您可以提出建议)以进行分类? 编辑:我想使用API来读取wav文件和使用K-means算法。

13得票2回答
在R中,k-means的返回值是什么?

我正在使用R中的kmeans()函数,我想知道返回对象的totss和tot.withinss属性之间的区别。从文档中看,它们似乎返回相同的内容,但是应用于我的数据集时,totss的值为66213.63,而tot.withinss的值为6893.50。如果您熟悉更多细节,请告诉我。谢谢!Marius。

13得票2回答
Weka简单的K-means聚类分配

我有一个看起来很简单的问题,但我似乎找不到答案。我对Weka相当新,但我觉得我在这方面做了一些研究(至少读了前几页的Google结果),但没有找到答案。 我正在使用Weka运行简单K-Means进行聚类。在结果列表中,我没有问题地可视化输出(“可视化聚类分配”),从我对K-Means算法的理...

13得票1回答
如何使用scikit-learn获取每个k-means聚类的惯性值?

我正在使用scikit learn进行聚类(k-means)。当我使用verbose选项运行代码时,它会打印每次迭代的惯性。 一旦算法完成,我想获得每个形成的簇的惯性(k个惯性值)。我该如何实现这一点?