我有一个非常庞大的数据集,并且正在尝试使用R构建分类模型。但是,我需要使用训练、测试和验证集。但是,我对如何执行此操作有些困惑。例如,我使用训练集构建了一棵树,然后使用测试集计算了预测值。但我认为我应该使用训练集和测试集来最佳调整决策树,之后再使用验证集进行验证。我应该如何做到这一点?
library(rpart)
part.installed <- rpart(TARGET ~ RS_DESC+SAP_STATUS +
ACTIVATION_STATUS+ROTUL_STATUS+SIM_STATUS+RATE_PLAN_SEGMENT_NORM,
trainSet, method="class")
part.predictions <- predict(part.installed, testSet, type="class")
(P.S. 这棵树只是一个例子,它可以是另一个分类算法)