我有一个看起来像这样的数据框:
A B C D NEW
0 1 Adhoc_Task WID WI_DTL []
1 1 Arun_adhoc_load ATT IXN_1 (IXN,)
2 1 Arun_adhoc_load ATT IXN_10 (IXN,)
3 1 Arun_adhoc_load ATT IXN_100 (IXN,)
4 1 Arun_adhoc_load ATT IXN_101 (IXN,)
5 2 Batch_Support ATT CDS_STATUS []
6 2 Batch_Support ATT CDS_CONTROL []
7 2 Batch_Support ATT CDS_ORA_STATUS []
8 2 Batch_Support ATT REP_FILTER []
9 1 online_load ATT TAX_3 (TAX,)
10 1 online_load ATT TAX_4 (TAX,)
11 1 online_load ATT TAX_8 (TAX,)
12 1 online_load ATT TAX_11 (TAX,)
期望的输出应如下所示:
A B C D NEW
0 1 Adhoc_Task WID WI_DTL []
1 1 Arun_adhoc_load ATT IXN_1 (IXN,)
5 2 Batch_Support ATT CDS_STATUS []
9 1 online_load ATT TAX_3 (TAX,)
我试图根据B列删除重复行。 但是,当我运行时
df.drop_duplicates(subset = ['B'], keep='first', inplace=True)
我收到了以下错误信息:
TypeError: drop_duplicates() got an unexpected keyword argument 'subset'
我正在使用Python 3中的pandas 0.19.1,因此我查看了这里的文档:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.drop_duplicates.html
我对如何在DataFrame中基于一列的值删除重复项的subset
没有任何头绪,请问应该怎么做?
df.drop_duplicates(['B'], inplace=True)
或df.drop_duplicates('B', inplace=True)
。 - jezraelValueError: keep must be either "first", "last" or False
- unasalusvictisTypeError: drop_duplicates()的参数'keep'有多个值
。 - unasalusvictis