12得票3回答
在caret(R语言)中提高模型训练速度

我有一个包含20个特征和大约300,000个观测值的数据集。我正在使用caret来训练模型,使用doParallel和四个核心。即使对我尝试过的方法(rf,nnet,adabag,svmPoly)中的10%数据进行训练,也需要超过八个小时。我正在使用自助法进行重采样3次,我的tuneLengt...

12得票1回答
Caret包:Train函数中的分层交叉验证

使用train函数拟合大型不平衡数据集的模型时,是否有进行分层交叉验证的方法?我知道直接使用k折交叉验证是可行的,但我的类别高度不平衡。我看过关于这个主题的讨论,但没有真正的明确答案。 提前感谢。

12得票1回答
在caret中提取glmnet模型的最佳调参参数的系数

我正在使用glmnet在caret中运行弹性网络正则化。 我将一系列值传递给trainControl来进行alpha和lambda的调整,然后执行repeatedcv以获取最佳的alpha和lambda调整参数。 以下是一个示例,其中alpha和lambda的最佳调整参数分别为0.7和0....

11得票3回答
使用caret包应用k折交叉验证模型

首先,我要说我已经阅读了许多关于交叉验证的文章,似乎存在很多困惑。我理解的是: 进行k折交叉验证,例如10个fold,以了解在这10个fold中的平均误差。 如果可接受,则在完整数据集上训练模型。 我正尝试使用R中的rpart构建决策树,并利用caret包。以下是我使用的代码。# lo...

11得票1回答
使用randomForest()和caret的randomForest (method = "rf")得到不同的结果

我对caret还不熟悉,想要确保我完全明白它在做什么。为此,我一直在试图使用caret的train()函数来复制使用method="rf"的randomForest()模型所得到的结果。不幸的是,我没有能够获得匹配的结果,我想知道我忽略了什么。 我还要补充一点,由于randomForest使...

11得票1回答
预测前是否需要对数据进行中心化和缩放?

在caret包的train函数中,可以像以下示例一样对预测变量进行居中和缩放:knnFit <- train(Direction ~ ., data = training, method = "knn", preProcess = c("center","...

11得票3回答
R包caret的confusionMatrix函数在处理缺失类别时的问题

我正在使用R包caret中的confusionMatrix函数来计算一些数据的统计信息。我将我的预测值和实际值都放入table函数中,得到要在confusionMatrix函数中使用的表格,如下所示: table(predicted,actual) 然而,存在多种可能的结果(例如A、B、C、...

11得票1回答
Caret包 - 使用平滑和线性预测变量进行交叉验证GAM

我希望使用caret对GAM模型进行交叉验证。我的GAM模型具有二元结果变量,纬度和经度坐标对的各向同性平滑以及线性预测因子。当使用mgcv时,典型的语法如下: gam1 <- gam( y ~ s(lat , long) + x1 + x2, family = binomial(lo...

11得票2回答
GLMNET中的自动caret参数调整失败

上下文和错误信息 我试图使用glmnet在caret中拟合一个二分类预测模型。使用caret默认的调优网格时,我遇到了一个错误。我不认为这是由于数据格式有误,因为当我指定自己的调优网格时,就没有问题了。 错误信息如下:Error in loop$lambda[loop$alpha == al...

10得票2回答
caret - 调参参数网格应该包含mtry列。

我正在使用这段代码: mtry <- round(sqrt(18), 0) gbmGrid <- expand.grid( interaction.depth = c(1, 2, 3, 4, 5, 6) , n.trees...