我将为您翻译以下内容:
我怀疑这可能是并行问题(例如这里)。然而,禁用并行执行并没有帮助。我有点迷失了。我知道有些人使用caret非常成功。它可能需要一些基础的东西,我可能漏掉了什么。
R版本信息
我正在尝试通过R中的caret软件包运行“gbm”。但是出现了“method”gbm.fit“ not found”的错误。 gbm软件包已加载,R、RStudio、caret和gbm已更新到最新版本(请参见下面的版本信息)。
这里有一个[可重复]的例子
加载所需的软件包
library(caret)
library(gbm)
library(foreach)
library(doParallel)
library(magrittr)
library(plyr)
启动并行(或不启动,结果相同)
cl=makeCluster(5)
registerDoParallel(cl)
为caret设置控制参数 - 基本上全部默认
gbm.fit.control = trainControl(method = "cv",
number = 5,
repeats = 1,
p = 0.75,
verboseIter = T,
returnData = TRUE,
summaryFunction = defaultSummary
selectionFunction = "best",
allowParallel = FALSE)
为参数搜索设置网格 - 没有什么特别的
gbmGrid <- expand.grid(interaction.depth = c(2,5,8),
n.trees = c(500,2000,5000),
shrinkage = c(0.1,0.01),
n.minobsinnode = c(10))
为这个示例生成虚拟数据。实际数据更加复杂,但是这个玩具示例的结果也是一样的。
tn.XY=data.frame(y=runif(100), x1=runif(100), x2=runif(100), x3=runif(100))
尝试运行训练函数
gbmFit3 <- train(y~x1+x2+x3, data = tn.XY,
method = "gbm",
trControl = gbm.fit.control,
verbose = FALSE,
tuneGrid = gbmGrid,
## Specify which metric to optimize
metric = "RMSE")
出现错误 = gbm.fit未找到
+ Fold1: shrinkage=0.01, interaction.depth=2, n.minobsinnode=10, n.trees=5000
model fit failed for Fold1: shrinkage=0.01, interaction.depth=2, n.minobsinnode=10, n.trees=5000
Error in do.call("gbm.fit", modArgs) : could not find function "gbm.fit"
- Fold1: shrinkage=0.01, interaction.depth=2, n.minobsinnode=10, n.trees=5000
+ Fold1: shrinkage=0.01, interaction.depth=5, n.minobsinnode=10, n.trees=5000
model fit failed for Fold1: shrinkage=0.01, interaction.depth=5, n.minobsinnode=10, n.trees=5000
Error in do.call("gbm.fit", modArgs) : could not find function "gbm.fit"
...
And it continues for every fold
我怀疑这可能是并行问题(例如这里)。然而,禁用并行执行并没有帮助。我有点迷失了。我知道有些人使用caret非常成功。它可能需要一些基础的东西,我可能漏掉了什么。
R版本信息
R version 3.2.1 (2015-06-18)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows 7 x64 (build 7601) Service Pack 1
locale:
[1] LC_COLLATE=English_United States.1252 LC_CTYPE=English_United States.1252 LC_MONETARY=English_United States.1252
[4] LC_NUMERIC=C LC_TIME=English_United States.1252
attached base packages:
[1] parallel splines stats graphics grDevices utils datasets methods base
other attached packages:
[1] plyr_1.8.3 magrittr_1.5 doParallel_1.0.8 iterators_1.0.7 foreach_1.4.2 gbm_2.1-06 survival_2.38-3
[8] caret_6.0-52 ggplot2_1.0.1 lattice_0.20-33 readr_0.1.1 installr_0.16.0