87得票1回答
使用多个核心时,tm_map转换函数的行为不一致

这篇文章的另一个潜在标题可能是“当使用R进行并行处理时,核心数量、循环块大小和对象大小的比例是否重要?" 我正在使用tm包对一个语料库进行一些转换。由于语料库很大,我正在使用doparallel包进行并行处理。 有时候转换可以完成任务,但有时候却不能。例如,tm::removeNumber...

52得票1回答
R中的doMC和doParallel有什么区别?

doParallel和doMC在R中与foreach函数有什么区别?doParallel支持Windows、类Unix系统,而doMC仅支持类Unix系统。换句话说,为什么doParallel不能直接取代doMC?谢谢。 更新: doParallel是建立在parallel之上的,它本质上是...

21得票2回答
为什么使用foreach %dopar% 每增加一个节点速度就会变慢?

我编写了一个简单的矩阵乘法测试多线程/并行化网络的能力,但我发现计算速度比预期慢得多。 测试内容很简单:对两个矩阵(4096x4096)进行乘法运算,并返回计算时间。不存储矩阵或结果。计算时间不是轻松的事情(根据处理器速度,需要50-90秒)。 测试条件如下:我使用1个处理器重复执行此计算...

19得票3回答
doParallel,集群 vs 核心

registerDoParallel(cl = makeCluster(detectCores())) 和 registerDoParallel(cores = detectCores())cl <- makeCluster(4) registerDoParallel(cl) 和...

18得票2回答
doParallel "foreach"在继承父环境对象方面存在不一致性: "Error in { : task 1 failed - "could not find function..."

我在使用foreach时遇到问题,但一直无法找到原因。下面的代码在我尝试过的两台Windows电脑上都出错了,但在三台运行相同版本的R和doParallel的Linux电脑上则正常: library("doParallel") registerDoParallel(cl=2,cores=2)...

15得票3回答
如何加速随机森林的训练?

我正在尝试训练多个随机森林(用于回归),以便让它们竞争,并查看哪些特征选择和参数能够提供最佳模型。但是,训练似乎需要大量时间,我想知道是否有做错的地方。 我用于训练的数据集(以下称为“train”)有217k行,58列(其中只有21列作为随机森林中的预测变量。它们都是数值或整数,除了一个布尔...

11得票3回答
当只在包的DESCRIPTION中导入foreach时如何使用%dopar%

如何避免在一个包的函数中出现“无法找到函数%dopar%”的问题,当该包的DESCRIPTION文件只是导入(imports)而不是依赖(depends)foreach时?是否有一种方式,就像我在函数中使用foreach :: foreach一样使用foreach ::%dopar%?谢谢。 ...

11得票2回答
如何在R中使用foreach循环导出多个函数或包?

我正在尝试通过在R中使用doParallel包来减少代码运行时间。 我调用了一个名为awareRateSIR的函数,并在该函数体内使用了一些额外的包。我遇到了一些错误,例如 找不到函数"vcount"和.. 我知道vcount是igraph包中的一个函数,它被用在awareRat...

9得票1回答
在并行环境下运行RSelenium

我该如何并行运行RSelenium? 下面是一个使用rvest并行的例子。 library(RSelenium) library(rvest) library(magrittr) library(foreach) library(doParallel) URLsPar <- c("...

8得票1回答
在 foreach %dopar% 中显示错误和警告信息

我刚开始使用foreach() %dopar%来进行并行操作,但我对它如何处理错误或警告有些问题。 when I use try() with my customized error message within foreach() %dopar%, the "native" error ...