在pandas中对多列数据执行相关性分析

4
在pandas中,是否可以对多列与一列进行相关性分析?例如:
DF[['A']['B']].corr(DF['C'])

1
使用 loc 选择所需的列,然后执行 corr - meW
1个回答

3
我相信您需要使用corrwith函数,并通过list选择多个列:
DF = pd.DataFrame({

         'B':[4,5,4,5,5,4],
         'C':[7,8,9,4,2,3],
         'A':[1,3,5,7,1,0],

})

print (DF[['A', 'B']].corrwith(DF['C']))
A    0.319717
B   -0.316862
dtype: float64

在这种情况下,我想要C与A和B的相关性,而不是与A和B作为单独的列进行比较。 - Tatenda D Kavu
@TatendaDKavu - 你能添加一些带有预期输出的示例吗?可以自由更改我的示例数据。 - jezrael
df = pd.DataFrame({ 'Gender':['男','女','男'], 'Marital_status':['单身','已婚','离异'], 'Sport':['田径','足球','游泳'],}) 预期结果如下:df[['Gender','Marital_status']].corr(df['Sport'])= 0.32。换言之,我想找出性别和婚姻状况与我喜欢的运动有何关联。 - Tatenda D Kavu

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接