16得票2回答
使用pandas计算加权相关系数

有没有一种方法可以使用 pandas 计算加权相关系数?我看到 R 有这样的方法。 另外,我想获得相关性的 p 值。在 R 中我没有找到。 关于加权相关系数的解释,请参考维基百科链接:https://en.wikipedia.org/wiki/Pearson_product-moment_co...

11得票3回答
皮尔逊相关系数和nan值

我有两个包含数百列的CSV文件,我想计算这两个CSV文件中每个相同列的Pearson相关系数和p值。问题在于,当一个列中出现缺失数据“NaN”时,会导致错误。当“.dropna”从列中删除NaN值时,有时X和Y的形状不相等(基于已删除的NaN值),我会收到此错误: "ValueError:op...

9得票1回答
如何解决使用pandas滚动相关性时出现的不一致结果?

首先声明,为了重现问题,我需要大量数据,这也是问题的一部分,因为我无法预测什么时候会出现异常。无论如何,数据太大(约13k行,2列),无法在问题中粘贴,我已在帖子末尾添加了pastebin链接。 我最近几天在使用pandas.core.window.rolling.Rolling.cor...

7得票2回答
皮尔逊相关系数在完全相关的数据集中失效。

考虑用户A和B对电影评分的数据集,以下是Pearson相关系数的几个示例: A = [2,4,4,4,4] B = [5,4,4,4,4] pearson(A,B) = -1 A = [5,5,5,5,5] B = [5,5,5,5,5] pearson(A,B) = NaN Pear...