我有以下相关性矩阵,它是使用pandas创建的:df.corr()
symbol aaa bbb ccc ddd eee
symbol
aaa 1.000000 0.346099 0.131874 -0.150910 0.177589
bbb 0.346099 1.000000 0.177308 -0.384893 0.301150
ccc 0.131874 0.177308 1.000000 -0.176995 0.258812
ddd -0.150910 -0.384893 -0.176995 1.000000 -0.310137
eee 0.177589 0.301150 0.258812 -0.310137 1.000000
从上面的数据框中,我需要将它转换为如下的3列数据框:
aaa aaa 1.000000
aaa bbb 0.346099
aaa ccc 0.131874
aaa ddd -0.150910
aaa eee 0.177589
bbb aaa 0.346099
bbb bbb 1.000000
bbb ccc 0.177308
bbb ddd -0.384893
bbb eee 0.301150
ccc aaa 0.131874
ccc bbb 0.177308
ccc ccc 1.000000
ccc ddd -0.176995
ccc eee 0.258812
ddd aaa -0.150910
ddd bbb -0.384893
ddd ccc -0.176995
ddd ddd 1.000000
ddd eee -0.310137
eee aaa 0.177589
eee bbb 0.301150
eee ccc 0.258812
eee ddd -0.310137
eee eee 1.000000
如图所示,这是相同的数据,只是呈现方式不同。每个原始数据帧中的列/行对都被简单地组合在新数据帧的自己的行中。
不幸的是,我无法弄清楚如何以数据框的形式完成这项任务。我尝试过使用 df.stack()
,但其结果是一个Series
而非数据框。我需要它成为一个数据框,以便我可以处理这些列。另一个问题是df.stack()
无法填充每一行,以下是一个小问题的示例:
aaa aaa 1.000000
bbb 0.346099
ccc 0.131874
ddd -0.150910
eee 0.177589
bbb aaa 0.346099
bbb 1.000000
ccc 0.177308
ddd -0.384893
eee 0.301150
etc...
df.rename_axis(None, axis=1)
不再起作用了。 - rpanai