Python Pandas:透视后重命名列

4

我有一个被枢轴的pandas数据框。我不知道如何更改列名,以便我可以继续以自然的方式处理被枢轴的数据框。下面是一个最小化的工作示例。

df = pd.DataFrame({'foo': ['one', 'one', 'one', 'two', 'two',
                            'two'],
                    'bar': ['A', 'B', 'C', 'A', 'B', 'C'],
                    'baz': [1, 2, 3, 4, 5, 6],
                    'zoo': ['x', 'y', 'z', 'q', 'w', 't']})

使用数据透视后,

df.pivot(index='foo', columns='bar', values=['baz', 'zoo'])

输出结果为:
      baz       zoo
bar   A  B  C   A  B  C
foo
one   1  2  3   x  y  z
two   4  5  6   q  w  t

为了得到下面的输出,下一步应该做什么?
   A_baz  B_baz  C_baz   A_zoo  B_zoo  C_zoo

one   1    2       3       x      y      z
two   4    5       6       q      w      t

非常感谢!

这是什么版本的 pandas?我在 .pivot() 上遇到了一个错误,错误信息为 Exception: Data must be 1-dimensional - Vivek Kalyanarangan
@VivekKalyanarangan - 对我来说,在pandas 0.23.4中它运行得很好。 - jezrael
不支持 '0.20.3' :( - Vivek Kalyanarangan
1
@VivekKalyanarangan - 如果有可能的话,是时候升级了 ;) - jezrael
@ Vivek Kalyanarangan - 我也遇到了使用pivot()时的同样错误,但是使用pivot_table()却可以正常工作。我的pandas版本是0.22.0。 - Marina
2个回答

11

使用列表推导式与 f-string

#python 3.6+
df.columns = [f'{j}_{i}' for i, j in df.columns]
#lower python versions
#df.columns = ['{}_{}'.format(j, i) for i, j in df.columns]
print (df)
    A_baz B_baz C_baz A_zoo B_zoo C_zoo
foo                                    
one     1     2     3     x     y     z
two     4     5     6     q     w     t

或者使用 DataFrame.swaplevelmapjoin

df = df.pivot(index='foo', columns='bar', values=['baz', 'zoo']).swaplevel(0,1,axis=1)

df.columns = df.columns.map('_'.join)
print (df)
    A_baz B_baz C_baz A_zoo B_zoo C_zoo
foo                                    
one     1     2     3     x     y     z
two     4     5     6     q     w     t

2

一种方法是使用来自 pyjanitorpivot_wider,使用 names_glue 参数重新塑造列名:

# pip install pyjanitor
import pandas as pd
import janitor

df.pivot_wider(
    index = 'foo', 
    names_from = 'bar', 
    values_from = ['baz', 'zoo'], 
    names_glue = "{bar}_{_value}")

   foo A_baz B_baz C_baz A_zoo B_zoo C_zoo
0  one     1     2     3     x     y     z
1  two     4     5     6     q     w     t

在 names_glue 字符串模板中,_value 作为来自 values_from 的值的占位符。{} 括号中的任何内容都应该来自 names_from 或 _value,以表示 values_from。请保留 HTML 标签。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接