我正在尝试使用randomForest进行分类,但是我一直收到错误消息,似乎没有明显的解决方案(在过去做回归时,randomForest对我非常有效)。 我已经粘贴了我的代码。 'success'是一个因子,所有的自变量都是数字。 有什么建议可以正确运行这个分类?
> rf_model<-randomForest(success~.,data=data.train,xtest=data.test[,2:9],ytest=data.test[,1],importance=TRUE,proximity=TRUE)
Error in randomForest.default(m, y, ...) :
NA/NaN/Inf in foreign function call (arg 1)
另外,这是数据集的一个样例:
head(data)
success duration goal reward_count updates_count comments_count backers_count min_reward_level max_reward_level
True 20.00000 1500 10 14 2 68 1 1000
True 30.00000 3000 10 4 3 48 5 1000
True 24.40323 14000 23 6 10 540 5 1250
True 31.95833 30000 9 17 7 173 1 10000
True 28.13211 4000 10 23 97 2936 10 550
True 30.00000 6000 16 16 130 2043 25 500
traceback()
来获取有关错误位置的更详细信息。 - joranchr
类。要么执行data$var <- as.factor(data$var)
,要么使用randomForest(as.factor(data$var) ~ ., ...)
进行预测可以解决这个问题。 - Hendylapply(your_data, class)
并检查是否存在类别为 "character" 的观测数据。 - Enrique Pérez Herrero