我正在进行多类分类(10个类)的工作。我正在使用sklearn.linear_model.SGDClassifier。我发现该模型使用一对多的方法。SGDClassifier有一个参数class_weight:“与类相关联的权重。如果没有给出,所有类都应该有权重为1。
“平衡”模式使用y的值自动调整权重,与输入数据中类频率成反比,即n_samples /(n_classes * np.bincount(y))。“ class_weight在训练期间如何使用?例如,我们有标签A-5个样本,标签B-15个样本和标签C-100个样本。假设正在训练模型A vs B和C。损失函数的计算是否包括class_weights?“评分”呢?SGDClassifier将“准确性”作为默认评分选项。它是加权的吗?
“平衡”模式使用y的值自动调整权重,与输入数据中类频率成反比,即n_samples /(n_classes * np.bincount(y))。“ class_weight在训练期间如何使用?例如,我们有标签A-5个样本,标签B-15个样本和标签C-100个样本。假设正在训练模型A vs B和C。损失函数的计算是否包括class_weights?“评分”呢?SGDClassifier将“准确性”作为默认评分选项。它是加权的吗?