我正在使用一些循环神经网络结构进行多标签分类。我的问题是关于损失函数的:我的输出将是真/假(1/0)值的向量,以指示每个标签的类别。许多资源都说汉明损失是适当的目标。然而,汉明损失在梯度计算中存在问题:
H = 平均(y_true XOR y_pred),XOR无法推导出损失的梯度。那么有没有其他用于训练多标签分类的损失函数?我已经尝试过MSE和二元交叉熵与单独的Sigmoid输入。
H = 平均(y_true*(1-y_pred)+(1-y_true)*y_pred)
是汉明损失的连续近似。