有没有办法在使用
根据这个数据框,我想要派生一个数据框,只包含唯一的
drop_duplicates
的同时添加条件?例如,我们有以下数据框:import pandas as pd
df = pd.DataFrame({
'Customer_Name': ['Carl', 'Carl', 'Mark', 'Joe', 'Joe'],
'Customer_Id': [1000,None,None,None,50000]
})
根据这个数据框,我想要派生一个数据框,只包含唯一的
Customer_Id
和 Customer_Name
行。 Customer_Id Customer_Name
0 1000 Carl
2 NaN Mark
5 50000 Joe
不幸的是,我无法使用drop_duplicates
方法进行删除,因为该方法总是会删除第一个或最后一个重复出现的项。
然而,在我的情况下,情况有所不同(请参见Carl和Joe)。此外,我也不能仅删除客户ID列中所有带有None条目的行,因为这样也会删除Mark的条目。
非常感谢任何帮助。
df.groupby('Customer_Name').first()
的方法吗? - Roman Pekar