22得票2回答
如何在R中的二元h2o GBM中为每个类别获取不同的变量重要性?

我想探索使用h2o中的GBM解决分类问题,以替代逻辑回归(GLM)。我的数据中的非线性和交互作用让我认为GBM更加合适。 我运行了一个基准GBM(见下文),并将其AUC与逻辑回归的AUC进行了比较。GBM表现得更好。 在经典的线性逻辑回归中,人们可以看到每个预测变量(x)对结果变量(y)的...

18得票3回答
GBM R函数:针对每个类别单独获取变量重要性

我正在使用R中的gbm函数(gbm包)来拟合用于多类分类的随机梯度提升模型。我只是尝试分别获取每个类别的每个预测变量的重要性,就像Hastie book(统计学习基础)(第382页)中的图片一样。请注意,不需要解释,保留HTML标签。 然而,函数summary.gbm仅返回预测变量的总体...

16得票1回答
gbm::interact.gbm与dismo::gbm.interactions的区别

背景 gbm包的参考手册说明interact.gbm函数计算Friedman的H统计量来评估变量交互作用的强度。H统计量在[0-1]的范围内。 dismo包的参考手册并未引用任何文献来说明gbm.interactions函数如何检测和建模交互作用。相反,它给出了一系列用于检测和建模交互作用...

14得票2回答
如何在R中使用XGBoost算法进行回归?

我尝试使用XGBoost技术进行预测。由于我的因变量是连续的,所以我正在使用XGBoost进行回归,但各个门户网站上提供的大多数参考资料都是用于分类。虽然我知道可以通过调整参数来使其适用于回归问题,但我希望能够找到一些更专门针对回归问题的参考资料。objective = "reg:linear...

13得票2回答
使用caret包寻找GBM的最佳参数

我正在使用R GBM包进行提升,对一些生物数据进行回归,其尺寸为10,000 X 932。我想知道什么是GBM包的最佳参数设置,特别是(n.trees、shrinkage、interaction.depth和n.minobsinnode)。当我在网上搜索时,发现R中的CARET包可以找到这样的...

13得票1回答
Caret训练方法报错:提示有错误,所有RMSE指标值都丢失。

尝试使用 gbm 或 rpart 模型进行拟合时,我多次遇到此错误。最终,我使用公开可用的数据成功地重现了这个错误。我注意到,在使用CV(或重复cv)时会出现此错误。当我不使用任何拟合控制时,就不会出现此错误。有人能够解释一下为什么我始终都会遇到这个错误吗?fitControl= trainC...

12得票2回答
GBM规则生成 - 编码建议

我使用R包GBM作为预测建模的首选。这个算法有很多优点,但唯一的“缺点”是我不能轻松地使用模型代码来计算在R之外的新数据。我想编写可以在SAS或其他系统中使用的代码(我将从SAS开始(无法访问IML))。 假设我有以下数据集(来自GBM手册)和模型代码:library(gbm) set.se...

12得票2回答
gbm函数中的下标越界问题

我遇到了一个奇怪的问题。我已经在我的笔记本电脑上成功运行了这段代码,但是当我尝试在另一台机器上运行它时,首先我会得到这个警告:分布未指定,假定伯努利分布......这是我预期的,但随后我会遇到这个错误:Error in object$var.levels[[i]] : subscript ou...

11得票1回答
在gbm多项式分布中,如何使用预测来获取分类输出?

我的回应是一个分类变量(一些字母),因此在建立模型时我使用了distribution ='multinomial',现在我想预测回应并以这些字母的形式获得输出,而不是概率矩阵。 然而,在predict(model,newdata,type ='response')中,它会给出概率,与type...

11得票2回答
使用h2o.randomForest()和h2o.gbm()绘制决策树。

寻找一种有效的方法,在rstudio、H2O的Flow或本地html页面中绘制树,类似于下面链接中图片所示的h2o的RF和GBM模型。 具体来说,如何为下面代码生成的对象(已拟合模型)rf1和gbm2绘制树,也许是通过解析h2o.download_pojo(rf1)或h2o.download_...