52得票8回答
使用Python生成随机森林特征重要性图表

我正在使用Python中的RandomForestRegressor,并希望创建一个图表来说明特征重要性的排名。这是我使用的代码: from sklearn.ensemble import RandomForestRegressor MT= pd.read_csv("MT_reduced....

47得票7回答
XGBoost实现的多输出回归

使用xgboost训练具有多个连续输出(多元回归)的模型是否可能? 训练此类模型的目标是什么? 提前感谢任何建议。

46得票3回答
随机森林变量重要性

我正在尝试在R中使用随机森林包进行分类。列出的变量重要性指标是: 类别0的变量x的平均原始重要性分数 类别1的变量x的平均原始重要性分数 MeanDecreaseAccuracy MeanDecreaseGini 现在我知道这些“mean”的含义,即我知道它们的定义。我想知道的是如何使...

44得票4回答
如何使用Scikit Learn调节随机森林模型的参数?

class sklearn.ensemble.RandomForestClassifier(n_estimators=10, criterion='gini', ...

42得票5回答
为随机森林回归模型设置ntree和mtry的值

我正在使用R包randomForest对一些生物数据进行回归分析。我的训练数据大小为38772 X 201。 我想知道,对于树的数量ntree和每个级别的变量数量mtry,应该设定多少最为合适?是否有近似的公式来找到这些参数的值? 我的输入数据中每一行都是一个200字符的氨基酸序列,我想要...

42得票4回答
随机森林调参 - 树深度和树的数量

我对调整随机森林分类器有一个基本的问题。树的数目和树的深度之间是否存在关联?树的深度是否必须小于树的数量?

39得票3回答
了解RandomForestRegressor中的max_features参数

在使用自举样本构建随机森林中的每棵树时,对于每个终端节点,我们从p个变量中随机选择m个变量以找到最佳分割(其中p是数据中所有特征的总数)。 我对RandomForestRegressor有以下问题: 1)max_features代表什么(m还是p还是其他)? 2)从max_features...

39得票3回答
在RandomForestRegressor中遇到了"continuous is not supported"错误。

我只是尝试做一个简单的RandomForestRegressor示例。但在测试准确性时,我遇到了这个错误 /Users/noppanit/anaconda/lib/python2.7/site-packages/sklearn/metrics/classification.pyc in ...

36得票6回答
使用Scikit-Learn在Python中为随机森林绘制决策树。

我想绘制一个随机森林的决策树。因此,我编写了以下代码: 我想绘制一个随机森林的决策树。因此,我编写了以下代码:clf = RandomForestClassifier(n_estimators=100) import pydotplus import six from sklearn impo...

35得票4回答
在sklearn中使用RandomForestClassifier进行不平衡分类

我有一个数据集,其中类别不平衡。类别分为'1'或'0',其中'1'类和'0'类比例为5:1。如何在使用sklearn的随机森林算法中计算每个类别的预测误差并相应地重新平衡权重,类似于以下链接中所示的操作:http://www.stat.berkeley.edu/~breiman/RandomF...