有人能解释一下scikit-learn中RandomForestClassifier和ExtraTreesClassifier之间的区别吗?我花了很多时间阅读这篇论文: P. Geurts,D. Ernst。和L. Wehenkel,“Extremely randomized trees”,机器学习,63(1),3-42,2006年。看起来这是ET的差异:
1)在选择分割变量时,从整个训练集中抽取样本,而不是从训练集的引导样本中抽取样本。
2)在每个分裂点上,完全随机地从样本的值范围中选择分裂。
这两个因素的结果是有更多的“叶子”。
1)在选择分割变量时,从整个训练集中抽取样本,而不是从训练集的引导样本中抽取样本。
2)在每个分裂点上,完全随机地从样本的值范围中选择分裂。
这两个因素的结果是有更多的“叶子”。