Pandas:从NumPy数组中填充数据帧列的缺失值

3

我有一个大小为k的numpy array,以及一个包含大小为n>k的列的pandas dataframe,其中包含k个缺失值。

是否有一种简单的方法来相应地从numpy array中填充k个缺失值(也就是说,在数据框的列中首次出现的缺失值对应于数组中的下一个值)?


请您提供一个带有一些样本数据值的示例,可以吗? - cs95
@COLDSPEED 抱歉,我是stackoverflow的新手,对界面还不太熟悉。基本上,我有一列包含缺失值的年龄数据。我尝试训练一个分类器来预测基于其他列的数据的缺失年龄,然后需要用这些预测值替换该列的缺失值。 - aygestan
1个回答

2

这样做可能会起作用。您还需要考虑您想以什么顺序(即排序)填充这些值。

fill_values = list(range(k)) #or whatever your array is
indicies_of_missing = df[df['myColumn'].isnull()].index # list of the missing indices
for fill_index, dataframe_index in enumerate(indicies_of_missing):
    dataframe.loc[dataframe_index, 'myColumn'] = fill_values[fill_index]

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接