Pandas DataFrame转置多列

7
我有一个如下的数据框。
a   x   10
b   x   11
c   x   15
a   y   16
b   y   17
c   y   19
a   z   20
b   z   21
c   z   23

我希望将它转换为以下内容:

    x   y   z
a   10  16  20
b   11  17  21
c   15  19  23

目前我正在将原始数据框拆分为多个数据框(分别为“a”、“b”和“c”),然后对其进行转置并合并回去。

我相信一定有最佳方案,因此在寻求帮助。

1个回答

8
使用 pivot 函数:
print (df)
   A  B   C
0  a  x  10
1  b  x  11
2  c  x  15
3  a  y  16
4  b  y  17
5  c  y  19
6  a  z  20
7  b  z  21
8  c  z  23

df = df.pivot(index='A', columns='B', values='C')
print (df)
B   x   y   z
A            
a  10  16  20
b  11  17  21
c  15  19  23

或者使用set_index方法和unstack方法:

df = df.set_index(['A','B'])['C'].unstack()
print (df)
B   x   y   z
A            
a  10  16  20
b  11  17  21
c  15  19  23

如果有重复值,使用汇总函数如meansum等,结合pivot_table进行数据透视。
print (df)
   A  B   C
0  a  x  10 <-same a,x different C = 10
1  a  x  13 <-same a,x different C = 13
2  b  x  11
3  c  x  15
4  a  y  16
5  b  y  17
6  c  y  19
7  a  z  20
8  b  z  21
9  c  z  23


df = df.pivot_table(index='A', columns='B', values='C', aggfunc='mean')

或者使用groupby + 聚合函数 + set_index

df = df.groupby(['A','B'])['C'].mean().unstack()
print (df)
B     x     y     z
A                  
a  11.5  16.0  20.0 <- (10 + 13) / 2 = 11.5
b  11.0  17.0  21.0
c  15.0  19.0  23.0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接