如何实现可变长度的递归神经网络？

Question

3

什么是将变长序列输入到循环神经网络（RNN）中的完整工作示例（不是片段）？

例如，PyTorch可以将变长序列作为输入实现到RNN中，但似乎没有完整工作代码的示例。

- mikal94305

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Thomas Wagenaar · Accepted Answer

很遗憾，'可变长度'的神经网络是不存在的。这是因为网络无法知道用哪些权重来处理它没有训练过的额外输入节点。

然而，你在那个页面上看到 '可变长度' 的原因是因为它们可以处理：

a b c d e
a b c d e f g h
a b c d
a b

as

a b c d e 0 0 0
a b c d e f g h
a b c d 0 0 0 0
a b 0 0 0 0 0 0

他们会将所有“空”变量转换为0。这是有道理的，因为无论权重如何，0都不会对网络的隐藏层产生任何影响，因为anything*0=0。

所以基本上，你可以有“可变长度”的输入，但你必须定义一些最大大小；所有小于该大小的输入都应该用零填充。

另一方面，如果你正在分类句子，你可以使用LSTM/GRU网络来顺序处理输入。