我希望能够比较两行数据,其中ID号码相同(例如第0行和第1行),然后删除绝对收入较小的那一行。是否有办法仅使用pandas函数而不是通过.itertuples()循环遍历行来完成这个操作。我想使用.shift和.apply,但不确定如何执行。
Index ID Income
0 2011000070 55019
1 2011000070 0
2 2011000074 23879
3 2011000074 0
4 2011000078 0
5 2011000078 0
6 2011000118 -32500
7 2011000118 0
我想要的输出:
Index ID Income
0 2011000070 55019
2 2011000074 23879
4 2011000078 0
6 2011000118 -32500