基于多列的唯一值

3

我有两列包含重复条目。请见下面的示例。 我想从这两列中删除重复项 原始列

MatchN  Striker
1000887 DA Warner
1000887 DA Warner
1000887 TM Head
1000887 TM Head

我希望最终能够得到以下结果:
MatchN  Striker
1000887 DA Warner
1000887 TM Head

我尝试使用

np.df[["MatchN"],["Striker"]].unique()

但它并没有起作用。 请问有什么最好的方法可以达到期望的结果吗?
1个回答

4

如果我理解正确,您需要使用DataFrame.drop_duplicates()方法:

In [69]: df = df.drop_duplicates(['MatchN','Striker'])

In [70]: df
Out[70]:
    MatchN    Striker
0  1000887  DA Warner
2  1000887    TM Head

df.drop_duplicates(["MatchN"],["Striker"]) 不起作用。 - Anoop Mahajan
1
@AnoopMahajan,你应该发布一个可重现的数据集... 请检查更新的答案。 - MaxU - stand with Ukraine
@AnoopMahajan,很高兴我能帮到你 :) - MaxU - stand with Ukraine

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接