加载视频数据集（Keras）

Question

加载视频数据集（Keras）

4

我正在尝试实现一个LRCN/C(LSTM)RNN来对视频中的情绪进行分类。我的数据集结构分为两个文件夹 - "train_set"和"valid_set"。打开它们中的任何一个，您都可以找到3个文件夹，"positive"、"negative"和"surprise"。最后，这3个文件夹中的每一个都有视频文件夹，每个视频文件夹都是一个以.jpg格式呈现的视频帧集合。由于视频长度不同，因此一个视频文件夹可能有200帧，而紧挨着它的那个可能有1200、700等！为了加载数据集，我使用flow_from_directory。在这里，我需要澄清几点：

在我的情况下，flow_from_directory会顺序逐一地加载视频吗？它们的帧？
如果我批量加载，flow_from_directory是否会根据视频图像的顺序按批次加载？
如果我有一个包含5张图像的video_1文件夹和一个包含3个视频的video_2文件夹，并且批处理大小为7，flow_from_directory会选择两个批次，分别为5和3个视频，还是会重叠视频，从第一个文件夹中取出所有5个图像+第二个文件夹中的2个图像？它会混合我的视频吗？
数据集加载是否是线程安全的？Worker 1按顺序从文件夹1中获取视频帧，Worker 2从文件夹2中获取等等...或者每个Worker都可以从任何位置和任何文件夹中获取帧，这可能会破坏我的顺序读取吗？
如果我启用shuffle，它会打乱读取视频文件夹的顺序，还是会随机从随机文件夹中开始获取帧？
TimeDistributed层是做什么的？从文档中我真的无法想象。如果我将其应用于CNN的密集层或CNN的每一层，会发生什么？

- KDX2

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Daniel Möller · Accepted Answer

flow_from_directory 是用于图像，而不是视频的。它不会理解您的目录结构，并且不会创建“帧”维度。您需要自己编写生成器（通常最好实现一个keras.utils.Sequence）。
只有在以下情况下才能分批加载：
- 由于视频长度不同，您逐个加载视频
- 您使用空帧填充视频以使其具有相同的长度
与1相同
如果您制作自己的生成器并实现了keras.utils.Sequence()，则只要您的实现知道每个视频是什么，就可以保持安全性。
如果您正在加载图像，则会对图像进行洗牌
TimeDistributed 允许在索引1处具有额外的维度。例如：通常需要(batch_size, ...其他维度...)的层将需要(batch_size, extra_dim, ...其他维度...)。这个额外的维度可能意味着任何东西，不一定是时间，并且它将保持不变。
- 循环层不需要这个（除非您真的想为不寻常的原因添加一个额外的维度），它们已经将索引1视为时间。
- CNN将完全相同地工作，对于每个图像，但您可以按照格式(batch_size, video_frames, height, width, channels)组织数据