假设我有以下DataFrame:
df = pd.DataFrame({'name':['john','mary','peter','jeff','bill'], 'matched_name':['mary','john','jeff','lisa','jose'], 'ratio':[78, 78, 22, 19, 45]})
print(df)
name matched_name ratio
0 john mary 78
1 mary john 78
2 peter jeff 22
3 jeff lisa 19
4 bill jose 45
我想根据以下条件删除重复的行:如果在交换它们的单元格位置后,列name
和matched
具有相同的值且ratio
也相同,则这些行被视为重复行。
根据上述规则, row 0
和 row 1
是重复的,因此我只保留 row 0
。 我如何使用Pandas实现呢?谢谢。
这是预期结果:
name matched ratio
0 john mary 78
1 peter jeff 22
2 jeff lisa 19
3 bill jose 45