sklearn.linear_model.SGDClassifier如何用于多类别分类?

3
我正在进行多类分类(10个类)的工作。我正在使用sklearn.linear_model.SGDClassifier。我发现该模型使用一对多的方法。SGDClassifier有一个参数class_weight:“与类相关联的权重。如果没有给出,所有类都应该有权重为1。
“平衡”模式使用y的值自动调整权重,与输入数据中类频率成反比,即n_samples /(n_classes * np.bincount(y))。“ class_weight在训练期间如何使用?例如,我们有标签A-5个样本,标签B-15个样本和标签C-100个样本。假设正在训练模型A vs B和C。损失函数的计算是否包括class_weights?“评分”呢?SGDClassifier将“准确性”作为默认评分选项。它是加权的吗?

损失函数是带权重的,请参见 https://dev59.com/f10Z5IYBdhLWcg3w3Dfk 。评分器则没有。 - Sergey Bushmanov
1个回答

0
这是我的理解。 分类器优化以下目标函数: enter image description here 其中,L 是损失函数,w 是类别权重。损失函数是用户定义的参数。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接