从Kmeans算法中找到每个聚类的分布

3
我正在尝试检测输入向量与给定聚类中心的匹配程度。我可以很容易地找到最佳匹配(与输入向量的欧几里得距离最小的中心是最佳的),然而,现在我需要确定这种匹配有多好。
为此,我需要找到构成质心的向量的分散程度(标准差?),然后查看从我的输入向量到中心的距离是否小于分散程度。如果距离大于分散程度,则应该能够说没有聚类来适应它(假设最佳匹配不适合输入向量)。
我不确定如何找到每个聚类的分散程度。我有所有的中心向量,所有的训练向量都带有它们最接近的聚类的标签,只是我不能完全明白我需要做什么来获得分散程度。
希望这样清楚吗?如果不是,我会尝试重新表述! TIA Ian
2个回答

4

使用距离函数,计算从您的中心点到每个带标签点的距离,然后计算这些距离的平均值。这将给出标准偏差。


1

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接