我正在使用随机森林来解决回归问题,以预测给定一组测试特征值 Test-X 的标签值 Test-Y。该模型已经在给定的训练特征 Train-X 和训练标签 Train-Y 上进行了训练。R 语言的 "randomForest" 在预测 Test-Y 的数值方面表现得非常好。但这还不是我想要的全部。
我希望随机森林能够生成概率密度函数,而不仅仅是一个数字。我已经搜索了几天,目前找到的解决方案如下:
1. "randomForest" 不会为回归问题生成概率,只适用于分类问题(通过 "predict" 并设置 type=prob)。
2. 使用 "quantregForest" 可以提供一种很好的方法来制作和可视化预测区间。但仍然不能生成概率密度函数!
对此您有什么其他想法吗?
我希望随机森林能够生成概率密度函数,而不仅仅是一个数字。我已经搜索了几天,目前找到的解决方案如下:
1. "randomForest" 不会为回归问题生成概率,只适用于分类问题(通过 "predict" 并设置 type=prob)。
2. 使用 "quantregForest" 可以提供一种很好的方法来制作和可视化预测区间。但仍然不能生成概率密度函数!
对此您有什么其他想法吗?
quantregForest
提供概率密度,但你可以预测的是ecdf
。 - catastrophic-failure