我有一个数据框,其中有332列。我想进行值填充以便使用scikit-learn的决策树分类器。我的问题是,填充函数生成的数据列只有330列。
from sklearn.preprocessing import Imputer
imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
cols = data.columns
new = imp.fit_transform(data)
print(data.shape,new.shape)
(34132, 332) (34132, 330)