sklearn.linear_model.SGDClassifier如何用于多类别分类？

Question

sklearn.linear_model.SGDClassifier如何用于多类别分类？

machine-learningscikit-learnmulticlass-classification

3

我正在进行多类分类（10个类）的工作。我正在使用sklearn.linear_model.SGDClassifier。我发现该模型使用一对多的方法。SGDClassifier有一个参数class_weight：“与类相关联的权重。如果没有给出，所有类都应该有权重为1。

“平衡”模式使用y的值自动调整权重，与输入数据中类频率成反比，即n_samples /（n_classes * np.bincount（y））。“ class_weight在训练期间如何使用？例如，我们有标签A-5个样本，标签B-15个样本和标签C-100个样本。假设正在训练模型A vs B和C。损失函数的计算是否包括class_weights？“评分”呢？SGDClassifier将“准确性”作为默认评分选项。它是加权的吗？

- Ekaterina Tcareva

损失函数是带权重的，请参见 https://dev59.com/f10Z5IYBdhLWcg3w3Dfk 。评分器则没有。 - Sergey Bushmanov

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- zdarktknight · Answer 1

这是我的理解。分类器优化以下目标函数：

其中，L 是损失函数，w 是类别权重。损失函数是用户定义的参数。