我正在尝试解决一个存在类别不平衡的二元分类问题。我的数据集中有210,000条记录,其中92%是0s,8%是1s。我在
在构建分类器时,我发现有两个参数:
我是否使用正确?class_weight和sample weight实际上是什么及应该使用什么?
python
中使用sklearn(v 0.16)
进行random forests
分类。在构建分类器时,我发现有两个参数:
sample_weight
和 class_weight
。我目前正在使用参数 class_weight="auto"
。我是否使用正确?class_weight和sample weight实际上是什么及应该使用什么?