我在Python中有一个DataFrame,如下所示,我们可以看到某些ID存在重复:
我需要选择出现ID = 123的情况,其中行是重复的,但在某些列中我们有不同的值,因此输出应该像下面这样:
在Python Pandas中,我该如何做呢?我的真实数据集中有很多列,因此我需要创建适用于更多列而不仅仅是ID、COL1、COL2、COL3的解决方案 :)
ID | COL1 | COL2 | COL3 |
---|---|---|---|
123 | XX | 111 | ENG |
123 | abc | 111 | ENG |
444 | ccc | 2 | o |
444 | ccc | 2 | o |
67 | a | 89 | xx |
ID | COL1 | COL2 | COL3 |
---|---|---|---|
123 | XX | 111 | ENG |
123 | abc | 111 | ENG |