假设有一个数据框 df1 如下:
Col1 Col2 Col3 Col4 Col5
-------------------------------------
A 1 AA 10 Test1
A 1 AA 5 Test2
A 2 AB 30 Test3
B 4 FF 10 Test4
C 1 HH 4 Test7
C 3 GG 6 Test8
C 3 GG 7 Test9
D 1 AA 4 Test5
D 3 FF 6 Test6
我想按Col1、Col2和Col3分组,并
添加新列Count:每个组的大小
添加新列Col4_sum:每个组中Col4的总和
需要的输出
Col1 Col2 Col3 Count Col4_sum
----------------------------------------
A 1 AA 2 15
A 2 AB 1 30
B 4 FF 1 10
C 1 HH 1 4
C 3 GG 2 13
D 1 AA 1 4
D 3 FF 1 6
我会尝试使用。
df1.groupby(['Col1','Col2','Col3']).size
但只获取Count列。