从Kmeans算法中找到每个聚类的分布

Question

3

我正在尝试检测输入向量与给定聚类中心的匹配程度。我可以很容易地找到最佳匹配(与输入向量的欧几里得距离最小的中心是最佳的)，然而，现在我需要确定这种匹配有多好。

为此，我需要找到构成质心的向量的分散程度(标准差？)，然后查看从我的输入向量到中心的距离是否小于分散程度。如果距离大于分散程度，则应该能够说没有聚类来适应它(假设最佳匹配不适合输入向量)。

我不确定如何找到每个聚类的分散程度。我有所有的中心向量，所有的训练向量都带有它们最接近的聚类的标签，只是我不能完全明白我需要做什么来获得分散程度。

希望这样清楚吗？如果不是，我会尝试重新表述！ TIA Ian

- n00dle

2个回答

1

如果您转换为使用其他算法，例如高斯混合模型，您将获得模型（聚类结果）的传播（例如标准偏差）。

- mattnedrich

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Joel · Accepted Answer

使用距离函数，计算从您的中心点到每个带标签点的距离，然后计算这些距离的平均值。这将给出标准偏差。