我感觉我在这里缺少了一些非常基础的东西。
我运行了一个随机森林回归:
INTERP.rf<-randomForest(y~.,data=df,importance=T,mtry=3,ntree=300)
然后提取了训练集的预测结果:
rf.predict<-predict(INTERP.rf,df,type="response")
RF.predict返回的%var值看起来过低,因此我进行了检查:
MSE.rf<-sum((rf.predict-y)^2)/length(y)
...并且得到的答案与检查rf.predict对象得到的结果大不相同。
请问有人能指出我的错误吗?
randomForest()
预测工作方式存在误解,无论是 OOB 还是针对“新”或原始数据。与其说某些东西是“垃圾”,不如链接到说明函数工作方式的文档和示例更有帮助。 - Forrest R. Stevens