我正在使用Scikit Learn的决策树对数据集进行回归分析。虽然我得到了非常好的结果,但是一个让我担心的问题是很多特征相对不确定性非常高。
我试着删除那些不确定性较高的案例,但这将大大降低模型的性能。
我试着删除那些不确定性较高的案例,但这将大大降低模型的性能。
这些特征本身是通过实验确定的,因此它们具有与之相关的实验不确定性。数据本身并不嘈杂。
所以我的问题是,是否有一种好的方法将特征相关的不确定性纳入到机器学习算法中?
感谢您的所有帮助!
这些特征本身是通过实验确定的,因此它们具有与之相关的实验不确定性。数据本身并不嘈杂。
所以我的问题是,是否有一种好的方法将特征相关的不确定性纳入到机器学习算法中?
感谢您的所有帮助!