我正在使用 pandas,我有一些数据集,看起来像这样:
ID-cell TOWNS NumberOfCrimes
1 Paris 444
1 Berlin 333
1 London 111
2 Paris 222
2 London 555
2 Berlin 3
3 Paris 999
4 Berlin 777
4 Paris 5
5 Paris 123
5 Berlin 8
6 Paris 1000
9 Berlin 321
12 Berlin 1
12 Berlin 2
12 Paris 1
. . .
这是一个非常庞大的数据集。我需要为每个城市保留仅有的5行最高犯罪率的记录,其余记录需要删除。
因此,我的输出应该如下所示:
ID-cell TOWNS NumberOfCrimes
6 Paris 1000
3 Paris 999
1 Paris 444
2 Paris 222
5 Paris 123
4 Berlin 777
1 Berlin 333
9 Berlin 321
5 Berlin 8
1 London 555
2 London 111
非常感谢您的帮助。我是新手,正在为学院做一些项目,而我的截止日期非常接近。 :/