Weka 上的主成分分析

5
我刚刚在训练集上计算了PCA,Weka返回了我新属性以及它们被选择和计算的方式。现在,我想使用这些数据构建模型,然后在测试集上使用该模型。
您是否知道是否有一种方法可以根据新属性类型自动修改测试集?
2个回答

7

您是需要主成分用于分析还是只是为了输入到分类器中?如果不是,请使用元->过滤分类器分类器。将过滤器设置为PrincipalComponents,分类器设置为您想要使用的任何分类器。对未转换的训练集进行训练,然后您就可以将未转换的测试集馈送给它。

如果您确实需要修改后的测试集,我建议使用知识流工具创建类似以下图片的内容:enter image description here


2
要在命令行中执行此操作,可以在以下链接找到文档:https://weka.wikispaces.com/Batch+filtering
以下是一个示例:
java weka.filters.supervised.attribute.AttributeSelection \
  -b -i train.arff -o train_pca.arff \
  -r test.arff -s test_pca_output.arff \
  -E "weka.attributeSelection.PrincipalComponents -R 0.95 -A 5" \
  -S "weka.attributeSelection.Ranker -T -1.7976931348623157E308 -N -1" 

在使用 -E 参数之前,使用 -c last 以保留输出类。 - vishnu viswanath

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接