我有一个航空数据集,正在尝试清理。 NumEngines
特征存在一些缺失值,但是在数据框的其他地方可以推导出某些缺失值(并非总是如此)。以下是我的数据集的迷你示例,以说明这两种情况。请注意,第一个Cessna条目可用于填充第二个条目,但对于Piper则不是这种情况。
df = pd.DataFrame()
df["Make"] = ["Cessna","Piper","Cessna","Boeing"]
df["Model"] = ["Citation","PA32RT","Citation","737-300"]
df["NumEngines"] = [2,None,None,2]
如何使生成的DataFrame如下:
Make Model NumEngines
0 Cessna Citation 2.0
1 Piper PA32RT NaN
2 Cessna Citation 2.0
3 Boeing 737-300 2.0