如何在R中并行运行多核的randomForest?

3

我有一个randomForest模型,想要在多个核心上进行计算。

如何告诉模型并行运行呢?

这不是parallel execution of random forest in R的重复,因为我不需要并行运行多个模型,我只想让一个模型并行运行。


@Florian 没问题,但请确认您的最佳知识是否组合会与运行完整模型相比实现此目的。我的意思是,如果我将运行foreach并使用1000棵树的5个“迭代”,然后进行组合,这是否与使用ntree = 5000的一个randomForest相同? - steves
1
据我所知,它们是等价的。随机森林只是使用一些随机性来生长独立的树木,因此无论这些树木是否在不同的森林中生长都没有关系。如果我们例如正在生长一个提升森林,那么情况就会有所不同,因为树木不再是独立生长的,而是按顺序生长的。 - Florian
1
使用 rangerrborist 将会有所帮助。更快的并行化,开箱即用。 - phiver
1个回答

2

我使用doMC包及其registerDoMC函数。效果非常好。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接