21得票1回答
在R语言中的RandomForest包中,RandomForest函数中的参数'classwt'代表什么意思?

randomforest::randomforest() 的帮助页面说: “classwt - 类的先验。不需要加起来为一。对于回归被忽略。” 如果数据集中的类别分布严重失衡,即类别的先验概率差异很大,设置classwt参数是否有助于模型训练? 当在一个包含3个类别的数据集上训练模型时,...

21得票2回答
在scikit-learn中结合随机森林模型

我有两个随机森林分类器模型,我想将它们合并成一个元模型。它们都是使用类似但不同的数据进行训练的。我该怎么做?rf1 #this is my first fitted RandomForestClassifier object, with 250 trees rf2 #this is my se...

20得票3回答
使用特征名称绘制特征重要性图表

在R中有预先构建的函数来绘制随机森林模型的特征重要性。但在Python中似乎缺少这种方法。我在matplotlib中搜索了一种方法。 model.feature_importances给我以下结果:array([ 2.32421835e-03, 7.21472336e-04, 2....

20得票1回答
OpenCV - 随机森林示例

有没有人使用2.3.1版本的Mat API而不是cvMat API来使用随机森林的示例? 基本上,我有一个名为Mat data的矩阵,它由1000行16x16x3个元素组成,并且有一个名为Mat responses的1000x1矩阵,它保存了每一行所属的类别。我希望在这上面运行随机森林算法。

20得票1回答
为什么单棵树的随机森林比决策树分类器好得多?

我使用以下代码将决策树分类器和随机森林分类器应用于我的数据: def decision_tree(train_X, train_Y, test_X, test_Y): clf = tree.DecisionTreeClassifier() clf.fit(train_X, ...

19得票4回答
如何在Python的Scikit-learn中输出随机森林中每个树的回归预测?

有没有办法获得随机森林中每棵树的预测结果,除了组合预测结果之外?我想将所有的预测结果输出到一个列表中,而不是查看整个决策树。我知道可以使用apply方法获取叶节点索引,但我不确定如何从叶节点中获取值。 编辑:以下是我在下面评论中得出的结果。以前我不清楚estimators_属性中的树可以被调...

19得票4回答
极度不平衡的类别随机森林

我正在解决一个非常不平衡的响应类别的大数据问题,使用随机森林算法。因此,我查阅了文档并找到了以下参数:strata sampsize 这些参数的文档很少(或者我没有找到它们),我真的不知道如何实现它。我正在使用以下代码:randomForest(x=predictors, ...

19得票1回答
下标越界(randomForest中的Caret变量重要性)

我已经用R训练了一个模型:require(caret) require(randomForest) myControl = trainControl(method='cv',number=5,repeats=2,returnResamp='none') model2 = train(incre...

19得票4回答
如何提高randomForest的性能?

我有一个大小为38 MB的训练集(12个属性,420000行)。我正在运行下面的R代码片段,使用randomForest训练模型。这对我来说需要几个小时。rf.model <- randomForest( Weekly_Sales~., ...

19得票1回答
Spark随机森林:使用相同的种子会产生不同的结果

运行Spark的随机森林算法时,即使使用相同的种子,每次运行时树中的分割也似乎会有所不同。请问是否有人可以友好地解释一下,我是在做错了什么(很可能),还是实现有问题(我认为这不太可能)?这是我的运行方案://read data into rdd //convert string rdd to ...