我希望将我的训练数据分为70%的训练,15%的测试和15%的验证。我使用caret软件包的createDataPartition()
函数进行分割。我将进行以下分割:
train <- read.csv("Train.csv")
test <- read.csv("Test.csv")
split=0.70
trainIndex <- createDataPartition(train$age, p=split, list=FALSE)
data_train <- train[ trainIndex,]
data_test <- train[-trainIndex,]
是否有一种类似于以下 H2o
方法的使用 createDataPartition()
进行训练、测试和验证集分割的方法?
data.hex <- h2o.importFile("Train.csv")
splits <- h2o.splitFrame(data.hex, c(0.7,0.15), destination_frames = c("train","valid","test"))
train.hex <- splits[[1]]
valid.hex <- splits[[2]]
test.hex <- splits[[3]]
rsample
包 https://topepo.github.io/rsample/ - alexpghayes