我刚刚在训练集上计算了PCA,Weka返回了我新属性以及它们被选择和计算的方式。现在,我想使用这些数据构建模型,然后在测试集上使用该模型。
您是否知道是否有一种方法可以根据新属性类型自动修改测试集?
您是否知道是否有一种方法可以根据新属性类型自动修改测试集?
您是需要主成分用于分析还是只是为了输入到分类器中?如果不是,请使用元->过滤分类器分类器。将过滤器设置为PrincipalComponents,分类器设置为您想要使用的任何分类器。对未转换的训练集进行训练,然后您就可以将未转换的测试集馈送给它。
如果您确实需要修改后的测试集,我建议使用知识流工具创建类似以下图片的内容:
java weka.filters.supervised.attribute.AttributeSelection \
-b -i train.arff -o train_pca.arff \
-r test.arff -s test_pca_output.arff \
-E "weka.attributeSelection.PrincipalComponents -R 0.95 -A 5" \
-S "weka.attributeSelection.Ranker -T -1.7976931348623157E308 -N -1"