根据另一列的值替换pandas数据框中的值

3

我正在尝试在多个中替换值,如果另一列中的值等于特定值。 对于下面的df,如果Col A == ABC,我想将所有整数替换为空值。

import pandas as pd

df = pd.DataFrame({          
    'B' : [10,20,30,40,50],
    'A' : ['ABC','DEF','XYZ','ABC','DEF'],          
    'C' : [1,1,1,1,1],              
    })

输出:

    B    A  C
0  10  ABC  1
1  20  DEF  1
2  30  XYZ  1
3  40  ABC  1
4  50  DEF  1

当 A 等于 ABC 时,我希望替换 Col B、C 中的整数。我尝试过以下方法:

mask = df.A != 'ABC'
col = ['B','C']
df = df.loc[mask, col].replace('')

但它只选择了我想要替换的值。我希望能得到以下结果:
    B    A  C
0  10  ABC  1
1      DEF   
2      XYZ   
3  40  ABC  1
4      DEF   
3个回答

3

如果想选择所有数值列,并通过条件使用 loc 设置为空字符串,请使用带有 np.integernp.numberselect_dtypes

mask = df.A != 'ABC'
#if want select all integer columns
col = df.select_dtypes(np.integer).columns
#if want select columns by names
#col = ['B','C']
df.loc[mask, col] = ''
print (df)
    B    A  C
0  10  ABC  1
1      DEF   
2      XYZ   
3  40  ABC  1
4      DEF   

2

您可以使用

In [189]: df[['B', 'C']] = df[['B', 'C']].where(df.A.eq('ABC'), '')

In [190]: df
Out[190]:
    B    A  C
0  10  ABC  1
1      DEF
2      XYZ
3  40  ABC  1
4      DEF

0

Pandas apply:

import pandas as pd

df = pd.DataFrame({          
    'B' : [10,20,30,40,50],
    'A' : ['ABC','DEF','XYZ','ABC','DEF'],          
    'C' : [1,1,1,1,1],              
    })
print(df.apply(lambda row: [i if isinstance(i,str) else '' for i in row.tolist()] if row['A']!='ABC' else row,axis=1))

输出:

     A   B  C
0  ABC  10  1
1  DEF       
2  XYZ       
3  ABC  40  1
4  DEF       

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接