34得票5回答
将Python随机森林模型保存到文件

在R中,运行“随机森林”模型后,我可以使用save.image("***.RData")存储模型。之后,我只需加载模型即可直接进行预测。 在Python中是否也可以类似地操作?我将模型和预测分开为两个文件。在模型文件中:rf= RandomForestRegressor(n_estimato...

34得票8回答
如何使用 row.names 属性在 R 中对数据框的行进行排序?

我创建了一个随机森林,预测了我的测试集的类别,它们正在一个数据框中幸福地生活着: row.names class 564028 1 275747 1 601137 0 922930 1 481988 1 ... `row.nam...

34得票5回答
在Python中,有没有一种简单的方法可以进行网格搜索而不需要交叉验证?

在scikit-learn中有一个名为GridSearchCV的非常有用的类,可以进行网格搜索和交叉验证,但我不想做交叉验证。我希望在网格搜索时不进行交叉验证,并使用整个数据集进行训练。 更具体地说,我需要在网格搜索期间使用“oob分数”评估由RandomForestClassifier创建...

33得票1回答
如何在Python的Scikit-learn中获取决策树深度?

我正在使用scikit-learn创建随机森林。然而,我想找到每棵树的个体深度。这似乎是一个简单的属性,但根据文档(http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier....

32得票4回答
随机森林输出解读

我已经对我的数据运行了一个随机森林,得到了一个矩阵形式的输出。 它应用了哪些规则来进行分类? 附言:我想要一个客户概要作为输出, 例如:来自纽约的人,在科技行业工作等。 我如何解释随机森林的结果?

30得票3回答
如何正确安全地使用RandomForestClassifier的predict_proba()函数

我正在使用Scikit-learn。有时候我需要得到标签/类别的概率,而不是标签/类别本身。例如,对于电子邮件的分类,我希望只知道某封电子邮件是垃圾邮件的概率为0.78,而不是简单地知道它是否是垃圾邮件。 为了实现这个目的,我正在使用RandomForestClassifier中的predic...

30得票3回答
随机森林与GridSearchCV - param_grid出现错误

我试图使用GridSearchCV创建一个Random Forest模型,但出现了与param_grid有关的错误:"ValueError: Invalid parameter max_features for estimator Pipeline. Check the list of ava...

30得票2回答
Numpy数组:按行搜索并获取行索引

我是numpy的新手, 正在使用Python实现随机森林的聚类。我的问题是: 如何找到数组中精确行的索引?例如[[ 0. 5. 2.] [ 0. 0. 3.] [ 0. 0. 0.]] 我要查找 [0. 0. 3.] 并得到结果为1(第二行的索引)。 有任何建议吗?以下是代...

27得票3回答
如何在R的随机森林中使用classwt?

我有一个高度不平衡的数据集,目标类实例的比例如下:60000:1000:1000:50(即总共有4个类)。我想使用randomForest来预测目标类。 为了减少类别不平衡,我尝试更改sampsize参数,并将其设置为c(5000, 1000, 1000, 50)和其他一些值,但并没有什么用...

27得票9回答
随机森林错误 - 新数据中的预测变量类型不匹配。

我正在尝试在R中使用分位数回归森林函数(quantregForest),它是建立在随机森林包上的。但我遇到了类型不匹配的错误,无法确定原因。 我使用以下方法训练模型: qrf <- quantregForest(x = xtrain, y = ytrain) 这段代码本身没有问题...