当我运行以下代码时,我对获得的不同结果感到困惑:
set.seed(100)
test1<-randomForest(BinaryY~., data=Xvars, trees=51, mtry=5, seed=200)
predict(test1, newdata=cbind(NewBinaryY, NewXs), type="response")
而这段代码:
set.seed(100)
test2<-randomForest(BinaryY~.,data=Xvars,trees=51, mtry=5,seed=200,xtest=NewXs, ytest=NewBinY)
这两个森林的混淆矩阵,由于相同的种子设置,我原以为会是一样的,但它们不同,预测值和投票也不同。起初我认为这只是打破平局的方式不同,所以我将树的数量改成了奇数,这样就不会再有平局了。
有人能否解释一下我希望这只是一个简单的疏忽?我只是想不通为什么对NewBinaryYs和NewX数据集应用这两个森林的预测结果不会相同。
另外,我注意到当我只使用1棵树时,结果是相同的。
感谢任何提示和帮助。