我希望使用Python和最可能的scipy实现(scipy.stats.spearmanr)计算斯皮尔曼等级相关性。
手头的数据看起来是这样的(字典形式):
{a:0.3, b:0.2, c:0.2} and {a:0.5, b:0.6, c:0.4}
现在将其传递到矛兵模块,如果我没错的话,我会为他们分配等级(降序):
[1,2,3] and [2,1,3]
现在我想考虑绑定,那么对于第一个向量,我现在会使用什么:
[1,2,2] or [1,2.5,2.5]
基本上,这个概念正确吗?如何处理这种基于字典的数据的平局。
正如@Jaime所建议的,spearmanr函数适用于值,但为什么会出现这种行为:
In [5]: spearmanr([0,1,2,3],[1,3,2,0])
Out[5]: (-0.39999999999999997, 0.59999999999999998)
In [6]: spearmanr([10,7,6,5],[0.9,0.5,0.6,1.0])
Out[6]: (-0.39999999999999997, 0.59999999999999998)
谢谢!