10得票1回答
“valid deviance”对于GBM模型为NaN,这是什么意思以及如何解决?

我正在使用梯度提升进行分类。虽然结果正在改善,但在validdeviance中我得到了NaN。Model = gbm.fit( x= x_Train , y = y_Train , distribution = "bernoulli", n.trees = GBM_NTREES...

10得票1回答
实现自己的梯度提升算法

我正在尝试编写自己的梯度提升算法。我知道有现成的包,例如gbm和xgboost,但我想通过编写自己的算法来理解其工作原理。我正在使用iris数据集,我的输出是Sepal.Length (连续型)。我的损失函数是 mean(1/2*(y-yhat)^2)(基本上是带有1/2的均方误差),因此相应...

9得票1回答
Python - Scikit用于查找分类变量的重要性

我正在尝试在Python中使用Scikit-learn来完成一些分类器问题(如RF、GBM等)。除了构建模型和进行预测外,我想查看变量的重要性。我知道有一种方法可以获取重要性。 importances = clf.feature_importances_ print(importances)...

9得票1回答
predict.gbm()的预测结果不一致

更新: 我已经在https://rdrr.io/snippets/上运行了代码,它可以正常工作。因此,我怀疑是我的R安装出了问题,但令人担忧的是,这种情况可能发生而没有错误或警告。有哪些最好的步骤来调查这个问题?我正在Ubuntu 18.04上运行R 3.4.4和gbm 2.1.4。 ...

9得票2回答
GBM多项式分布,如何使用predict()获得预测类别?

我正在使用R语言中的gbm包中的多项式分布。当我使用predict函数时,会得到一系列的数值: 5.086328 -4.738346 -8.492738 -5.980720 -4.351102 -4.738044 -3.220387 -4.732654 但我想获取每个类别出现的概率。如何...

8得票1回答
插值分类阈值

我一直在使用RStudio中的caret包中的gbm来查找故障发生的概率。 我使用Youden's J方法找到了最佳分类的阈值,为0.63。现在如何使用这个阈值呢?我认为最好的方法是将阈值某种方式纳入到caret的gbm模型中,以获得更准确的预测,然后再次在训练数据上运行该模型?目前默认值为...

7得票1回答
R中的GBM崩溃问题

我在Rstudio中尝试使用gbm(formula, data)来处理我的数据集。但是在Windows和Mac上,Rstudio会在没有任何提示的情况下崩溃(只显示“Rstudio需要重新启动”)。您有什么办法可以解决这个问题吗? 谢谢。

7得票1回答
使用gridsearchcv进行梯度提升分类器的参数调优(Python)

我想通过gridsearchcv来运行GradientBoostingClassifier()。对于每种参数组合,我还需要以表格形式获得“精确率”、“召回率”和准确度。这是代码: scoring= ['accuracy', 'precision','recall'] parameters ...