基于多列的唯一值

Question

3

我有两列包含重复条目。请见下面的示例。我想从这两列中删除重复项原始列

MatchN  Striker
1000887 DA Warner
1000887 DA Warner
1000887 TM Head
1000887 TM Head

我希望最终能够得到以下结果：

MatchN  Striker
1000887 DA Warner
1000887 TM Head

我尝试使用

np.df[["MatchN"],["Striker"]].unique()

但它并没有起作用。请问有什么最好的方法可以达到期望的结果吗？

- Anoop Mahajan

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- MaxU - stand with Ukraine · Accepted Answer

如果我理解正确，您需要使用DataFrame.drop_duplicates()方法：

In [69]: df = df.drop_duplicates(['MatchN','Striker'])

In [70]: df
Out[70]:
    MatchN    Striker
0  1000887  DA Warner
2  1000887    TM Head