我有一个数据集,其中有一列名为“原籍国”的列,包含约30000条记录。其中一些记录是缺失的,用NaN
表示,因此我想用mode()
值来填充它们。 我写了这样的代码:
data['Native Country'].fillna(data['Native Country'].mode(), inplace=True)
然而,当我计算缺失值数量时:
for col_name in data.columns:
print ("column:",col_name,".Missing:",sum(data[col_name].isnull()))
对于“Native Country”列,它仍然显示相同数量的NaN
值。