我想用NaN替换数据框中某一列中的错误数值。
mydata = {'x' : [10, 50, 18, 32, 47, 20], 'y' : ['12', '11', 'N/A', '13', '15', 'N/A']}
df = pd.DataFrame(mydata)
df[df.y == 'N/A']['y'] = np.nan
尽管最后一行失败并抛出警告,因为它在df
的副本上工作。那么,正确的处理方式是什么?我看到许多解决方案使用iloc
或ix
,但在这里我需要使用布尔条件。