我正在使用循环神经网络进行领域特定分类研究,已经积累了数千万条文本数据。由于整个数据集需要花费数日甚至数月才能运行完毕,因此我选择了一小部分数据进行测试,例如100万条文本(其中80%用于训练,20%用于验证)。我对整个语料库进行了词向量化的预处理,并将Dropout应用于模型以避免过拟合。当它在12小时内训练了60000条文本时,损失已经降到了相当低的水平,准确率达到了97%。我是否应该继续训练?继续训练有帮助吗?
目前仍在进行第一次迭代,我担心如果现在停止,模型可能无法完全覆盖...
目前仍在进行第一次迭代,我担心如果现在停止,模型可能无法完全覆盖...