我有一个简单的数据框 df
:
a,b
1,2
1,3
1,4
1,2
2,1
2,2
2,3
2,5
2,5
我想检查在
a
中的每个组是否存在与 b
重复的条目。目前我已经做了以下工作:g = df.groupby('a')['b'].unique()
这将返回:
a
1 [2, 3, 4]
2 [1, 2, 3, 5]
但我想要的是一个列表,列出a
中每个组在b
中出现的多个情况。在这种情况下,预期输出应该是:
a
1 [2]
2 [5]
g[g>1]
。 - Pierre L