我正在尝试使用FeatureUnion
从数据结构中提取不同的特征,但由于维度不同而失败:ValueError: blocks[0,:] has incompatible row dimensions
实现
我的FeatureUnion
是这样构建的:
features = FeatureUnion([
('f1', Pipeline([
('get', GetItemTransformer('f1')),
('transform', vectorizer_f1)
])),
('f2', Pipeline([
('get', GetItemTransformer('f2')),
('transform', vectorizer_f1)
]))
])
GetItemTransformer
用于从相同结构的数据中获取不同部分。这个想法在 scikit-learn 的问题追踪器here中有描述。
结构本身存储为{'f1': data_f1, 'f2': data_f2}
,其中data_f1
是具有不同长度的不同列表。
问题
由于 Y 向量与数据字段不同,我假设错误发生了,但是如何将向量缩放以适应两种情况?