我想知道为什么在使用tidymodels中的ranger和直接使用ranger时,我得到的模型不一样?
这里有一个可复现的例子:
这里有一个可复现的例子:
library(tidymodels)
library(ranger)
# load data
data("iris")
train <- iris |> slice_sample(prop = 0.7)
test <- iris |> anti_join(train)
# rf model specs
rf_mod <-
rand_forest(trees = 10) |>
set_engine("ranger", respect.unordered.factors = TRUE, probability = FALSE) |>
set_mode("classification")
# fit model using tidymodels
set.seed(100)
rf_mod |> fit(Species ~ ., data = train) # OOB=4.81%
# fit model using ranger directly
set.seed(100)
ranger(Species ~ ., data = train,
num.trees=10, respect.unordered.factors = TRUE, probability = FALSE) # OOB=5.77%