紧凑距离矩阵和冗余距离矩阵有什么区别?

3

对Python和编程一无所知:

squareform文档如下所示:

将向量形式的距离向量转换为方形距离矩阵,反之亦然。

将1D数组转换为平方矩阵?

参数X:

可以是压缩或冗余距离矩阵。

返回结果:

如果传递压缩的距离矩阵,则返回冗余的距离矩阵;如果传递冗余的距离矩阵,则返回压缩的距离矩阵。

  1. 压缩矩阵和冗余矩阵有什么区别?
  2. 压缩/冗余矩阵与采用何种向量/平方形式有什么关系?

pdist函数返回压缩距离矩阵:

返回压缩距离矩阵Y。对于每个i和j(其中i小于j小于n),计算并存储度量距离(u=X[i],v=X[j])在条目ij中。

我是否正确地认为Y的每个元素存储特定点与另一个点之间的距离? 有3个观察结果的示例将意味着具有9个元素的压缩矩阵吗?


这个问题:https://dev59.com/Umcs5IYBdhLWcg3wLAyf 看起来和你的问题很相似,是吗? - Warren Weckesser
@WarrenWeckesser 相关但不同,stackoverflow.com/questions/13079563/ 它默认了我提出的问题,所以它是在自问自答吗?除非我漏掉了什么。 - user6204921
当我们说:“如果y是一个一维压缩距离矩阵,那么y必须是一个(n 2)大小的向量,其中n是在距离矩阵中成对出现的原始观测值的数量。”(n 2)代表什么意思? - akshit bhatia
1个回答

2
如果您有一个nxn矩阵,那么从集合N中的每个成对组合都存在两次,一次是ab,一次是ba。因此,如果您从一组N点创建距离矩阵,则可以通过仅存储每个点一次并忽略任何点之间的比较来压缩数据。
例如,如果我们有点a,b和c,则会得到以下距离矩阵:
    a    b    c
a   0    ab   ac
b   ba   0    bc
c   ca   cb   0

以及压缩的距离矩阵,

    a    b    c
         ab   ac
              bc

由于距离测量器是未签名的,所以这个简化表格保留了所有信息。

@kkpie "距离测量器是无符号的" 这是什么意思? - user6204921
1
从a到b的向量是反平行的,并且在大小上等于从b到a的向量。这意味着它们在由它们的方向定义的一维向量空间中具有相反的符号和相同的度量或大小。 - kpie
1
@Will 两个物体之间的距离是一种忽略对顺序的度量。 - kpie
在什么条件下,距离矩阵是方阵?如果原始距离矩阵是mxn(例如,euclidean.distances(df1,df2)的输出,其中df1和df2具有相同的列数但不同的行数/观测值),那么压缩距离矩阵传递了什么含义? - 3pitt

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接