Pandas中fillna(0)的相反操作是什么?

6
df.fillna(0)可以用来填充所有缺失的NA/NaN值为0,那么是否有一种函数可以将-NA/NaN值替换为另一个值,例如1?
如果DataFrame中的值是可变长度列表,则: - df.replace()需要列表具有相同的长度 - 类似于df[len(df) > 0] = 1的布尔索引会抛出ValueError: cannot insert True, already exists的错误 - pandas.get_dummies()抛出了TypeError: unhashable type: 'list'的错误。
是否有更简单的解决方案?
2个回答

4
你可以使用索引/赋值操作df[df.notnull()] = 1。例如:
>>> df = pd.DataFrame([[np.nan, 2, 5], [2, 5, np.nan], [2, 5, np.nan]])
>>> df # example frame
    0  1   2
0 NaN  2   5
1   2  5 NaN
2   2  5 NaN

>>> df[df.notnull()] = 1
>>> df
    0  1   2
0 NaN  1   1
1   1  1 NaN
2   1  1 NaN

2
我不知道是否有内置函数,但是这个方法可以实现:
import pandas as pd
import numpy as np

df = pd.DataFrame(data={'a':[np.nan, 13, 32]})

 >>    a
   0  NaN
   1   13
   2   32

df = df.applymap(lambda x: 1 if not np.isnan(x) else x)

 >>     a
    0 NaN
    1   1
    2   1

我不得不使用类似于 isinstance(x, list) 而不是 numpy.isnan(x) 来防止出现 TypeError,但使用 lambda 函数可以解决这个问题。 - interpolack

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接