使用xgboost进行分类时,如何获得置信区间或预测分散度度量?

7

如何在使用xgboost进行分类时获得置信区间或预测离散度的度量?

例如,如果xgboost预测事件的概率为0.9,则如何获得该概率的置信度?

另外,这个置信度被认为是异方差的吗?

1个回答

8

要为xgboost模型生成置信区间,您应该训练多个模型(可以使用装袋技术)。每个模型都将为测试样本产生一个响应-所有响应将形成一个分布,您可以使用基本统计学轻松计算置信区间。您应该为每个测试样本生成响应分布。


我建议运行100个模型(越多越好),并检查95%的值所在范围。响应变量是同方差的。 - pplonski
3
预测值的均值和标准差与置信区间不同。 - michel
当然,预测的平均值和标准差与置信区间是不同的概念 - 问题是如何计算置信区间,我给出了一个方法。 - pplonski
你好 @pplonski,这100个模型有什么不同之处?只是种子不同,还是训练数据也不同?谢谢 - itscarlayall
只需改变种子 - pplonski

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接