从pandas中删除非重复行

Question

8

这其实很简单，但是我理解不了。假设有下面这个数据框，我想只保留'y'列中有重复值的行：

所需输出如下：

我尝试了这个：

df[~df.duplicated('y')]

但是我得到了这个：

- mallet

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Anton vBR · Accepted Answer

keep：{'first'，'last'，False}，默认为'first'

first: 标记除首次出现之外的重复项为True。

last: 标记除最后一次出现之外的重复项为True。

False: 将所有重复项标记为True。

这意味着您正在寻找：

df[df.duplicated('y',keep=False)]

输出：