我正在使用scikit-learn中的随机森林算法来拟合一个大约30MB的训练数据,但我的笔记本电脑在运行时总是因为应用程序内存不足而崩溃。测试数据比训练数据还要大几倍。我的设备是Macbook Air 2GHz 8GB内存。
有哪些方法可以解决这个问题呢?
rf = RandomForestClassifier(n_estimators = 100, n_jobs=4)
print "20 Fold CV Score: ", np.mean(cross_validation.cross_val_score(rf, X_train_a, y_train, cv=20, scoring='roc_auc'))