我使用scikit-learn训练了一个ExtraTreesClassifier(基尼指数),并且它基本符合我的需求。准确度不是很高,但使用10倍交叉验证,AUC为0.95。我想在我的工作中使用这个分类器。我对机器学习还比较新,如果我问错了什么,请原谅我。
我绘制了一些ROC曲线,通过它,似乎我有一个特定的阈值,我的分类器开始表现良好。我想将这个值设置在拟合的分类器上,这样每次我调用预测时,分类器都会使用该阈值,我可以相信FP和TP率。
我还看到了这篇文章(scikit .predict() default threshold),其中指出阈值不是分类器的通用概念。但由于ExtraTreesClassifier具有predict_proba方法,并且ROC曲线也与阈值定义相关,因此我应该可以指定它。
我没有找到任何参数或任何可用于此目的的类/接口。我如何为已训练的ExtraTreesClassifier(或任何其他分类器)在scikit-learn中设置阈值?
非常感谢, Colis
我绘制了一些ROC曲线,通过它,似乎我有一个特定的阈值,我的分类器开始表现良好。我想将这个值设置在拟合的分类器上,这样每次我调用预测时,分类器都会使用该阈值,我可以相信FP和TP率。
我还看到了这篇文章(scikit .predict() default threshold),其中指出阈值不是分类器的通用概念。但由于ExtraTreesClassifier具有predict_proba方法,并且ROC曲线也与阈值定义相关,因此我应该可以指定它。
我没有找到任何参数或任何可用于此目的的类/接口。我如何为已训练的ExtraTreesClassifier(或任何其他分类器)在scikit-learn中设置阈值?
非常感谢, Colis