随机森林中的种子是什么作用?

7
我知道在通常情况下,设置种子是为了能够重现相同的结果。但是,在随机森林中设置种子实际上会产生什么影响呢?它是否会改变R中randomForest()函数的任何参数,如nTree或sampSize?
我每次都使用不同的种子来构建我的随机森林模型,但我想知道不同的种子如何影响随机森林模型。

1
请点击此处了解 R 中种子的相关信息。由于 randomForest 生成随机树,设置种子将保证相同的输出结果。对于正常使用,请不要对种子进行任何操作,它将默认为“随机”。 - Axeman
不同的种子不会改变nTreesampSize,但它可能会稍微改变模型的结果,尤其是当像ntree这样的参数设置为较低值时,影响会更加明显。 - Axeman
1
@Axeman 请考虑添加一篇带有解释的答案。 - Pierre L
1个回答

4
树是由种子生长出来的,森林也是如此;-)(scnr)
建立随机森林有不同的方法,然而,所有方法都有一个共同点:建立多个树。为了提高分类准确性,随机森林中的各个树需要有所区别,否则您将得到 nTree 次相同的树。通过在树的生成中引入随机性来实现此差异。随机性受到种子的影响,种子最重要的是使用相同的种子应始终生成相同的结果。
随机性如何影响树的创建?有多种方式。 - 为随机子集构建树。对于森林中的每棵单独的树,都会绘制一些训练示例的子集,然后针对该子集构建一棵树。 - 在树的每个决策点上,随机选择决策属性。
通常这两个元素会结合起来。

http://link.springer.com/article/10.1023%2FA%3A1010933404324#page-1


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接