Keras中的多对一和多对多LSTM示例

Question

Keras中的多对一和多对多LSTM示例

machine-learningneural-networkdeep-learningkerasrecurrent-neural-network

159

我会尝试理解LSTMs以及如何使用Keras构建它们。我发现，原则上有4种模式可以运行RNN（图片中的右侧4种）。

图片来源：Andrej Karpathy 现在我想知道每个模式在Keras中的最简代码片段是什么样的，类似于：

model = Sequential()
model.add(LSTM(128, input_shape=(timesteps, data_dim)))
model.add(Dense(1))

针对这4个任务，可能需要稍微解释一下。

- Luca Thiede

对于一对多架构的图表，位于第一个X输入右侧的RNN单元也需要输入。它们通常可以设置为前一个单元的输出（o或y）或默认零向量。 - Vass

2个回答

17

来自@Marcin Możejko的优秀回答。

我想在第5点中补充以下内容（具有不同输入/输出长度的多对多）：

A）与香草LSTM一样

model = Sequential()
model.add(LSTM(N_BLOCKS, input_shape=(N_INPUTS, N_FEATURES)))
model.add(Dense(N_OUTPUTS))

作为编码器-解码器LSTM

model.add(LSTM(N_BLOCKS, input_shape=(N_INPUTS, N_FEATURES))  
model.add(RepeatVector(N_OUTPUTS))
model.add(LSTM(N_BLOCKS, return_sequences=True))  
model.add(TimeDistributed(Dense(1)))
model.add(Activation('linear'))

- gustavz

7

请问你能否解释一下B)编码器-解码器LSTM结构的细节？我对"RepeatVector"和"TimeDistributed"步骤的作用还不是很理解。 - Marsellus Wallace

请问您能否帮忙解决如何正确地为多对多或编码器-解码器模型提供多维数据的问题？我主要是在处理形状方面遇到了困难。假设我们有一个存储在数组中的完整数据集，其形状为（45000，100，6）=（Nsample，Ntimesteps，Nfeatures），即我们有45000个样本，每个样本有100个时间步长和6个特征。 - Djordje Savic

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Marcin Możejko · Accepted Answer

所以：

一对一：由于您不处理序列，因此可以使用 Dense 层：
```
model.add(Dense(output_size, input_shape=input_shape))
```
一对多:由于在Keras中连接模型不太容易，因此不支持这个选项。因此，以下版本是最简单的：

model.add(RepeatVector(number_of_times, input_shape=input_shape))
model.add(LSTM(output_size, return_sequences=True))

多对一: 实际上，你的代码片段（几乎）是这种方法的一个例子：

model = Sequential()
model.add(LSTM(1, input_shape=(timesteps, data_dim)))

多对多：当输入和输出的长度与循环步数相同时，这是最简单的片段：

model = Sequential()
model.add(LSTM(1, input_shape=(timesteps, data_dim), return_sequences=True))

当步数与输入/输出长度不同时的多对多情况：在Keras中这非常困难。没有简单的代码片段可以处理它。

编辑：广告5

在我的最近一些应用程序中，我们实现了类似于第4张图中的多对多的东西。如果你想要一个具有以下架构的网络（当输入比输出更长时）：

                                        O O O
                                        | | |
                                  O O O O O O
                                  | | | | | | 
                                  O O O O O O

您可以通过以下方式实现此目标：

model = Sequential()
model.add(LSTM(1, input_shape=(timesteps, data_dim), return_sequences=True))
model.add(Lambda(lambda x: x[:, -N:, :])) #Select last N from output

其中N是您想覆盖的最后几个步骤的数量（在图像中N = 3）。

从这一点出发到达：

                                        O O O
                                        | | |
                                  O O O O O O
                                  | | | 
                                  O O O

通过使用例如0向量对长度为N的人工填充序列进行调整，使其适应所需的大小，这就是简单的方法。