我正在使用R和randomForest包进行实验,我有一些支持向量机和神经网络的经验。我的第一个测试是尝试回归:sin(x)+高斯噪声。使用神经网络和SVM,我可以获得相当好的sin(x)近似值,因此噪声被过滤掉,学习算法不会过度拟合。(对于良好的参数)但是在使用randomForest时,我得到了完全过度拟合的解决方案。我只是使用(R 2.14.0,在2.14.1上也尝试过,以防万一):
library("randomForest")
x<-seq(-3.14,3.14,by=0.00628)
noise<-rnorm(1001)
y<-sin(x)+noise/4
mat<-matrix(c(x,y),ncol=2,dimnames=list(NULL,c("X","Y")))
plot(x,predict(randomForest(Y~.,data=mat),mat),col="green")
points(x,y)
我猜在randomForest中有一个神奇选项可以使其正确运行,我尝试了几个选项,但没有找到正确的操作方法...