如何在Python的Scikit-learn中获取决策树深度？

Question

如何在Python的Scikit-learn中获取决策树深度？

pythonscikit-learnrandom-forestdecision-treedepth

33

我正在使用scikit-learn创建随机森林。然而，我想找到每棵树的个体深度。这似乎是一个简单的属性，但根据文档（http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html），没有访问它的方法。

如果不可能，是否有一种从决策树模型中访问树深度的方法？

任何帮助将不胜感激。谢谢。

- iltp38

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- jme · Accepted Answer

每个实例的`RandomForestClassifier`都有一个`estimators_`属性，它是一个包含多个DecisionTreeClassifier实例的列表。文档显示，`DecisionTreeClassifier`实例具有`tree_`属性，这是`Tree`类(我认为是未记录的)的一个实例。在解释器中的一些探索显示，每个`Tree`实例都有一个`max_depth`参数，看起来这可能是您要查找的内容--再次强调，这是未经记录的。

无论如何，如果`forest`是您的`RandomForestClassifier`实例，则：

>>> [estimator.tree_.max_depth for estimator in forest.estimators_]
[9, 10, 9, 11, 9, 9, 11, 7, 13, 10]

这应该能解决问题。

每个估算器还有一个get_depth()方法，可以用更简洁的语法检索相同的值：

>>> [estimator.get_depth() for estimator in forest.estimators_]
[9, 10, 9, 11, 9, 9, 11, 7, 13, 10]

为了避免混淆，需要注意每个估计器（而不是每个估计器的tree_）都有一个叫做max depth 的属性，它返回参数的设置而不是实际树的深度。下面的示例说明了estimator.get_depth()、estimator.tree_.max_depth和estimator.max_depth之间的关系：

from sklearn.datasets import load_iris
from sklearn.ensemble import RandomForestClassifier
clf = RandomForestClassifier(n_estimators=3, random_state=4, max_depth=6)
iris = load_iris()
clf.fit(iris['data'], iris['target'])
[(est.get_depth(), est.tree_.max_depth, est.max_depth) for est in clf.estimators_]

输出：

[(6, 6, 6), (3, 3, 6), (4, 4, 6)]

将最大深度设置为默认值None会使第一棵树扩展到深度7，并且输出结果如下：

[(7, 7, None), (3, 3, None), (4, 4, None)]