我在填充NaN时遇到了一些问题。我想要将一个包含几个NaN的数据框列,用从“查找表”中派生的值来填充它们,该值基于另一列的值。(您可能会从泰坦尼克号数据集中认出我的数据)...
Pclass Age
0 1 33
1 3 24
2 1 23
3 2 NaN
4 1 Nan
我希望用'series' pclass_lookup的值来填充NaN值:
pclass_lookup
1 38.1
2 29.4
3 25.2
我尝试使用索引来执行fillna操作,例如:
df.Age.fillna(pclass_lookup[df.Pclass]), but it gives me an error of
ValueError: cannot reindex from a duplicate axis
lambda表达式也是一种尝试:
df.Age.map(lambda x: x if x else pclass_lookup[df.Pclass]
但是,这似乎也不完全正确。我是不是完全误解了这里的意思?'