我有一个长这样的 DataFrame...
idn value
0 ID1 25
1 ID1 30
2 ID2 30
3 ID2 50
我想在这个表格中增加另一列,显示按'idn'分组后的最大'value'值。
我希望得到下面这样的结果。
idn value max_val
0 ID1 25 30
1 ID1 30 30
2 ID2 30 50
3 ID2 50 50
我可以使用类似以下方式的分组操作,提取 'value' 的最大值...
df[['idn', 'value']].groupby('idn')['value'].max()
然而,我无法将该结果合并回原始数据框中。
有什么最好的方法来获得所需的结果吗?
谢谢你。
.transform('max')
也是这个的快捷方式 :) - Andy Haydenlambda c: print('我喜欢lambda表达式')
:) - Paul H