我正在处理一个包含100多个特征的大型数据集(这些特征都是相关的,因为它们已经被筛选过了;原始数据集有超过500个特征)。我使用caret包中的train()函数和"ranger"方法创建了一个随机森林模型。
问题是:如何提取所有变量的重要性,而不仅仅是前20个最重要的变量?默认情况下,varImp()函数只提供前20个变量的重要性。
以下是一些示例代码(不包括非常庞大的训练集):
问题是:如何提取所有变量的重要性,而不仅仅是前20个最重要的变量?默认情况下,varImp()函数只提供前20个变量的重要性。
以下是一些示例代码(不包括非常庞大的训练集):
library(caret)
rforest_model <- train(target_variable ~ .,
data = train_data_set,
method = "ranger",
importance = "impurity)
以下是提取变量重要性的代码:
varImp(rforest_model)
importance(rforest_model)
会导致以下错误信息:“Error in UseMethod("importance") : no applicable method for 'importance' applied to an object of class "c('train', 'train.formula')"” - Flavio Abdenur