首先,我有一个数据框(df),当我根据其中一列分组时,是否会删除重复值?第二个问题是,如何知道哪些分组中有重复的值(我尝试找出如何知道数据框中哪些列有重复值,但找不到任何信息,它们只是讨论每个元素是否重复)。
ex i have a df like this:
A B C
1 1 2 3
2 1 4 3
3 2 2 2
4 2 3 4
5 2 2 3
after groupby('A')
A B C
1 2 3
4 3
2 2 2
3 2
2 3
我想知道有多少组A有B重复,以及有多少组A有C重复。
result:
B C
1 1 2
or maybe better can caculate percent
B : 50%
C : 100%
谢谢
level=0
是什么意思?然后它似乎在处理我的数据时运行缓慢(191600 行和 300 列如果我将它们分组)。其次,我已经编辑了我的问题,您能帮我吗? - robocon20x