我目前正在使用Tensorflow Seq2seq模型尝试实现情感分析。我的想法是将IMDB评论馈送给编码器,[Pad]或[Go]馈送给解码器,将[neg]/[pos]馈送给目标。我的大部分代码与seq2seq翻译的示例相似。但我得到的结果非常奇怪。对于每个批处理,结果要么全部是[neg],要么全部是[pos]。
"编码器输入:我几乎立刻入迷了。[pad][pad][pad]"
"解码器输入:[pad]"
"目标:[pos]"
由于这个结果非常特殊,我想知道有没有人知道会导致这种情况发生的原因?