我有两组N维数组,需要比较它们并得出一个代表它们“相似度”的值。从统计学角度来看,这是一个双样本拟合优度问题,即假设这两个数组源自同一总体分布。
为了简化起见,可以想象如下所示的2维数组:
为了简化起见,可以想象如下所示的2维数组:
添加
我找到了一个scipy
包,它似乎可以做我需要的事情,但它只适用于1-D数组:scipy.stats.ks_2samp。统计软件R
有ks package,其中包括kde.test
函数。这个函数可以满足我的需求,但我想要一个python
实现。
np.mean()
)可以告诉您它们的中心相距多远。计算协方差矩阵行列式(np.cov()
)可以描述一个近似椭球体的体积。 - Dietrichscipy.stats.ks_2samp
或kde.test
的统计检验的python
实现,适用于多维数据。SE上的人不一定有这个信息。 - Gabriel