Pandas如何将分组和行合并为列?

4

我将尝试转换这个数据集:

A   B   C
1   x1  a
1   x1  a
1   x1  b
2   x2  b
2   x2  a

into:

A   B   C1  C2  C3
1   x1  a   a   b
2   x2  b   a   null

df = pd.DataFrame({ 'A': [1, 1, 1, 2, 2],
                'B': ['x1', 'x1', 'x1', 'x2', 'x2'],
                'C': ['a', 'a', 'b', 'b', 'a']
                })

这里的回答与我的需要有一定的相似之处,但是轴心不太适用于我。

如何在Pandas中按键分组转置数据框?
2个回答

4
使用groupby+apply -
v = df.groupby(['A' ,'B']).C.apply(lambda x: x.tolist())

df = pd.DataFrame(v.tolist(), index=v.index)\
       .rename(columns=lambda x: x + 1)\
       .add_prefix('C')\
       .reset_index()
df

   A   B C1 C2    C3
0  1  x1  a  a     b
1  2  x2  b  a  None

3
你可以使用set_indexunstack
In [196]: (df.set_index(['A', 'B', df.groupby(['A', 'B']).cumcount()+1])['C']
             .unstack()
             .add_prefix('C')
             .reset_index())
Out[196]:
   A   B C1 C2    C3
0  1  x1  a  a     b
1  2  x2  b  a  None

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接