谱聚类 vs 层次聚类

3

有人能解释一下使用层次聚类比光谱聚类有什么优势吗?我知道它们的工作原理,但我想知道在哪些情况下更好地使用层次聚类而不是光谱聚类。

3个回答

4

层次聚类:

  • 对于分类数据,这是一种很好的方法。
  • 将相似的点连接在一起,直到最终形成包含所有数据点的单个聚类。
  • 从组合所有数据后获得的结果被称为树状图。
  • 根据你想要的聚类数量,在树状图上进行切割。

谱聚类:

  • 这是针对复杂数据形状的聚类方法,因为K-means和基于密度的聚类在这些情况下失败了。
  • 将数据点视为图的顶点,连接足够接近的顶点。因此,您还选择一个ε值。所有距离小于ε的顶点都会被连接。
  • 与层次聚类不同,你不会得到完全连接的单个图(除非你选择一个高的ε值且没有非连接部分)。相反,你会得到多个连接的组件,每个组件代表一个聚类。

3

层次聚类和谱聚类

层次聚类通常更快,并且产生一个漂亮的树状图以进行研究。

树状图非常有用,可以帮助您了解您是否具有良好的聚类方法。

此外,层次聚类非常灵活。您可以使用不同的距离函数和链接策略。

谱聚类具有有趣的理论;但是要使其真正有效,您的数据必须已经包含良好分离的“连接组件”。当您拥有非常嘈杂的数据时,祝您好运。


0
  • 使用分层集群,您可以获得更多关于集群之间关系的信息,因为可以在不同数量的集群处进行切片,并查看较低k时如何将集群组合在一起。
  • 使用分层方法,可以对聚类进行一次计算,这取决于数据集的大小,可能非常有优势,并在不同的k值处对结果进行切片。
  • 凝聚聚类(一种分层方法)每次都会产生相同的结果,而谱聚类具有随机成分。
  • 由于分层性附加约束条件,与轮廓和惯性等客观度量标准相比,分层方法通常在任何给定k时表现较差。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接