在深度学习中,我们应该根据训练/验证损失和准确率选择最佳模型,但我如何知道哪个点是最好的?仅依赖于验证准确率而不考虑其他指标吗?还有两个相关问题:最佳训练/验证损失和准确率曲线是什么样子的?如果训练损失在降低,训练准确率在提高,但验证损失在增加,验证准确率在长时间训练后停止提高,我该怎么办?它看起来像这样:- 训练准确率 - 训练损失 - 验证准确率 - 验证损失
首先,您需要根据开发/验证数据集的结果选择模型。因此,使用验证准确性和验证损失来评估模型的性能。在某种程度上,更高的验证准确性通常与较低的验证损失相关。这是因为您的损失用于衡量预测结果与实际结果之间的差异。不同的问题需要使用不同的指标进行衡量,就像我们通常在机器翻译中使用 BLEU 分数一样,您需要阅读一些关于您研究领域的论文,以了解哪种指标更受欢迎。训练损失的减少和验证损失的增加在模型训练中是很正常的现象,通常意味着您的模型出现了过拟合。它只学习了出现在训练数据集中而不是整个数据集中的特征。至于处理过拟合的方法,有许多方法,例如早期停止、删除层等。您可以通过谷歌搜索来了解更多信息。