汉明损失中的梯度计算对于多标签分类

Question

汉明损失中的梯度计算对于多标签分类

machine-learningneural-networkgradient-descenthamming-distancemultilabel-classification

5

我正在使用一些循环神经网络结构进行多标签分类。我的问题是关于损失函数的：我的输出将是真/假（1/0）值的向量，以指示每个标签的类别。许多资源都说汉明损失是适当的目标。然而，汉明损失在梯度计算中存在问题： H = 平均（y_true XOR y_pred），XOR无法推导出损失的梯度。那么有没有其他用于训练多标签分类的损失函数？我已经尝试过MSE和二元交叉熵与单独的Sigmoid输入。

- William Chou

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Juan Wang · Accepted Answer

5

H = 平均(y_true*(1-y_pred)+(1-y_true)*y_pred)

是汉明损失的连续近似。

- Juan Wang

嗨Juan，感谢你的回答。在你的近似方程中，我想知道y_true和y_pred是概率还是实际标签？ - William Chou

y_true 是实际标签，而 y_pred 是概率。 - Juan Wang