我对sklearn如何应用我们提供的类别权重很感兴趣。文档没有明确说明类别权重在哪里和如何应用。阅读源代码也没有帮助(似乎sklearn.svm.liblinear用于优化,但我无法阅读源代码因为它是一个.pyd文件...)
但我猜它是在代价函数上起作用:当指定类别权重时,相应类别的代价将乘以类别权重。例如,如果我有2个观测值,每个观测值来自类别0(权重=0.5)和类别1(权重=1),则代价函数将为:
成本= 0.5 * log(...X_0,y_0 ...)+ 1 * log(...X_1,y_1 ...)+惩罚
有人知道这是否正确吗?
但我猜它是在代价函数上起作用:当指定类别权重时,相应类别的代价将乘以类别权重。例如,如果我有2个观测值,每个观测值来自类别0(权重=0.5)和类别1(权重=1),则代价函数将为:
成本= 0.5 * log(...X_0,y_0 ...)+ 1 * log(...X_1,y_1 ...)+惩罚
有人知道这是否正确吗?