比较两个N维数组

4
我有两组N维数组,需要比较它们并得出一个代表它们“相似度”的值。从统计学角度来看,这是一个双样本拟合优度问题,即假设这两个数组源自同一总体分布。
为了简化起见,可以想象如下所示的2维数组:

enter image description here

我需要提供一个数字来量化它们之间的“相似程度”。是否有一个Python包提供这样的统计测试?我可以使用numpy、scipy、scikit-learn等。请保留HTML标签。

添加

我找到了一个scipy包,它似乎可以做我需要的事情,但它只适用于1-D数组:scipy.stats.ks_2samp。统计软件Rks package,其中包括kde.test函数。这个函数可以满足我的需求,但我想要一个python实现。


1
需要多么严谨呢?对于一个简单的度量,您可以比较均值和协方差矩阵。 - Joe Kington
3
有很多方法可以比较点云。例如,计算平均距离(np.mean())可以告诉您它们的中心相距多远。计算协方差矩阵行列式(np.cov())可以描述一个近似椭球体的体积。 - Dietrich
3
这样的统计检验比较模糊。请查看http://stats.stackexchange.com。 - embert
2
此问题似乎与编程无关,应在统计 SE 上提问。 - Hooked
我在询问一个类似于scipy.stats.ks_2sampkde.test的统计检验的python实现,适用于多维数据。SE上的人不一定有这个信息。 - Gabriel
显示剩余4条评论
1个回答

1

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接