我正在使用Weka的探索功能进行分类。
因此,我有一个包含两个数值类型特征和一个二元0或1类别(例如{0,1})的.arff文件。
样本:
@RELATION summary
@ATTRIBUTE feature1 NUMERIC
@ATTRIBUTE feature2 NUMERIC
@ATTRIBUTE class {1,0}
@DATA
23,11,0
20,100,1
2,36,0
98,8,1
.....
我加载这个.arff文件,使用10折交叉验证(没有测试文件),选择NaiveBayes,然后对数据进行分类,结果显示:5个标签错误,100个标签正确。到目前为止一切顺利。
现在,我显著改变了我的.arff文件(给我的特征属性完全随机的值)。重复上述过程,但当我进行分类时,得到了完全相同的统计结果。
我尝试了更改.arff文件的其他值和不同的分类算法。但是,无论我给我的.arff文件什么值,都会得到完全相同的统计结果(在相同算法下)。
我在这里做错了什么吗?