21得票1回答
如何使用caret包跟踪模型构建过程中的进度?

我正在尝试使用caret包中的train函数构建模型: model <- train(training$class ~ .,data=training, method = "nb") 训练集包含约20K个观测值,每个观测值具有超过100个变量。我想知道从该数据集构建模型是否需要数小时或数...

21得票3回答
为什么Caret训练会占用这么多内存?

当我只使用 glm 进行训练时,一切正常,并且我甚至没有接近耗尽内存。但是当我运行 train(..., method='glm') 时,我会用完内存。 这是因为 train 在交叉验证的每次迭代(或者其他 trControl 过程)中存储了大量数据吗?我查看了 trainControl,但...

20得票3回答
时间序列-数据拆分和模型评估

我尝试使用机器学习来基于时间序列数据进行预测。在 stackoverflow 的一个问题中(CARET 包中 createTimeSlices 函数的使用示例),展示了如何使用 createTimeSlices 进行模型训练和参数调整的交叉验证: library(caret) l...

18得票4回答
随机森林中varImp(caret)和importance(randomForest)的区别

我不明白caret包中的varImp函数和randomForest包中的importance函数在随机森林模型中有什么区别: 我计算了一个简单的RF分类模型,当计算变量重要性时,我发现两个函数的“排名”不同: 这是我的代码:rfImp <- randomForest(Origin ~...

17得票2回答
如何在使用R中的caret训练后计算ROC和ROC下的AUC?

我使用了caret包的train函数进行了10折交叉验证。同时,我也通过在trControl中设置classProbs = TRUE来获取了预测类别的分类概率,如下所示:myTrainingControl <- trainControl(method = "cv", ...

17得票1回答
将PCA预处理参数传递给train()函数

我正在尝试使用caret构建一个预测模型,其中使用PCA作为预处理。预处理步骤如下:preProc <- preProcess(IL_train[,-1], method="pca", thresh = 0.8) 我可以直接将thresh参数传递给caret的train()函数吗?我已经...

17得票2回答
使用caret软件包进行的变量重要性评估(错误);随机森林算法

我正在尝试以任何方式获取随机森林模型的变量重要性。这是我迄今为止尝试过的方法,但非常欢迎提供替代建议。 我在R中训练了一个模型:require(caret) require(randomForest) myControl = trainControl(method='cv',number=5...

17得票1回答
使用caret在R中进行交叉验证的支持向量机

我被告知要使用caret软件包,以便在我的数据集上执行10折交叉验证的支持向量机回归。我正在将我的响应变量绘制为151个变量。我按照以下步骤进行:-> ctrl <- trainControl(method = "repeatedcv", repeats = 10) > se...

16得票1回答
了解 {caret} train(tuneLength = ) 和 {kernlab} 中的 SVM 方法

尝试更好地理解{caret}中的train(tuneLength=)如何工作。当我尝试理解来自{kernlab}的SVM方法之间的一些差异时,我感到困惑。我已经查阅了文档(此处)和{caret}培训页面(此处)。 我的玩具示例是使用iris数据集创建五个模型。结果在此处,可再现的代码在此处(...

16得票3回答
使用 caret 和 gbm 方法进行多类别分类的技巧

我正在解决一个多类别分类问题,并尝试使用R中的广义提升模型(gbm包)。 我遇到的问题是:caret的train函数与method="gbm"结合使用时貌似不能正确处理多类别数据。下面是一个简单的示例: library(gbm) library(caret) data(iris) fitCo...