改进k-means聚类

Question

13

我的计算机视觉课程笔记中提到，如果我们知道聚类的标准差，可以改善k-means聚类算法的性能。

我的想法是，我们可以通过基于直方图的分割先使用标准差来得出更好的初始估计。你认为呢？感谢任何帮助！

- Dhruv Gairola

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- ang mo · Accepted Answer

你的讲师可能有Veenman等人在2002年发表的论文在脑海中。基本思想是设定每个簇内允许的最大方差。你从与数据点数量相同的簇开始，然后通过以下方式“演化”簇：

（这种演化作为全局优化过程，在防止初始簇均值赋值中可能出现的不良后果方面非常有效）

总之，如果您知道方差，就知道簇应该有多种变化，因此更容易检测异常值（通常应放入单独的簇中）。