第一次发帖,如有错误敬请谅解。
我在使用R中的caret包进行分类。我正在使用重复的10折交叉验证来拟合一些模型(GBM、线性SVM、NB、LDA)。使用自定义的trainControl,caret甚至为我提供了一整套模型性能指标,如ROC、Spec/sens、Kappa、Accuracy等。这真是太棒了。但是我还想要一个度量模型校准的指标。
我注意到caret中有一个函数,可以创建一个校准图,以估计模型在数据部分上性能的一致性。是否可以让caret在交叉验证模型构建过程中为每个测试折叠计算这个指标?或者它只能应用于我们正在进行预测的一些新保留数据上?
为了更好地理解,目前我的情况类似于:
fitControl <- trainControl(method = "repeatedcv", repeats=2, number = 10, classProbs = TRUE, summaryFunction = custom.summary)
gbmGrid <- expand.grid(.interaction.depth = c(1,2,3),.n.trees = seq(100,800,by=100),.shrinkage = c(0.01))
gbmModel <- train(y= train_target, x = data.frame(t_train_predictors),
method = "gbm",
trControl = fitControl,
tuneGrid = gbmGrid,
verbose = FALSE)
如果有帮助的话,我使用了约25个数字预测器和N=2,200,在预测一个双分类因子。非常感谢您提前提供的任何帮助和建议。 Adam