汉明损失中的梯度计算对于多标签分类

5
我正在使用一些循环神经网络结构进行多标签分类。我的问题是关于损失函数的:我的输出将是真/假(1/0)值的向量,以指示每个标签的类别。许多资源都说汉明损失是适当的目标。然而,汉明损失在梯度计算中存在问题: H = 平均(y_true XOR y_pred),XOR无法推导出损失的梯度。那么有没有其他用于训练多标签分类的损失函数?我已经尝试过MSE和二元交叉熵与单独的Sigmoid输入。
1个回答

5

H = 平均(y_true*(1-y_pred)+(1-y_true)*y_pred)

是汉明损失的连续近似。


嗨Juan,感谢你的回答。在你的近似方程中,我想知道y_true和y_pred是概率还是实际标签? - William Chou
y_true 是实际标签,而 y_pred 是概率。 - Juan Wang

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接