Seaborn clustermap:主要参数是观测值还是距离?

3

data参数是指传递给seaborn clustermap的数据。该参数需要一个矩阵,其中每个单元格都是原始矩阵中观测值向量之间的距离。如果您传递原始观测值矩阵,则clustermap会自行计算距离。

在第一种情况下,metric参数的作用是什么?它用于指示用于计算距离的度量标准吗?


1
我的这个回答详细说明了clustermap()中的距离计算。 - Ulrich Stern
1个回答

2
显然 - 看看您链接的页面上的“示例” - 它期望一个数据表格和一个用于计算距离的度量标准。
正如clustermap的文档清楚说明的那样,它使用scipy.spatial.distance.pdist来计算成对距离。
我没有看到使用预先计算的距离矩阵的选项,尽管可能可以传递一个自定义函数来进行矩阵查找。

那么有一件事我不明白,为什么在检索聚类并计算余弦度量的示例中,我们的范围是0到600?余弦难道不应该在-1到1之间吗?我错过了什么吗? - foebu
颜色不是距离,而是输入数据。 - Has QUIT--Anony-Mousse

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接