我正在使用R内的H2O库对一个包含70百万行和25个数字特征的训练集进行随机森林分类模型测试。总文件大小为5.6 GB。验证文件的大小为1 GB。我的系统配置为16 GB RAM和8个核心CPU。系统成功地将这两个文件读取到了H2O对象中。然后我输入以下命令来构建模型:
model <- h2o.randomForest(x = c(1:18,20:25), y = 19, training_frame = traindata,
validation_frame = testdata, ntrees = 150, mtries = 6)
但是,几分钟后(没有生成任何决策树),我遇到了以下错误:
"Error in .h2o.doSafeREST(conn = conn, h2oRestApiVersion = h2oRestApiVersion, : Unexpected CURL error: Recv failure: Connection reset by peer"
然而,如果我尝试使用1棵决策树进行上述代码,则成功运行。
以上错误是否由于内存问题引起?任何帮助将不胜感激。