如何设计卷积神经网络（层的输入和输出）？

Question

3

我是一名初学者，正在逐步学习深度学习。我有一个有关设计网络的问题。我在论文中看到了具有不同输入/输出的层，但我不知道如何在实现之前进行计算/设计。例如，在这篇论文中，图表层输出旁边有一些数字（请参见以下图片）。这些过滤器大小和其他参数如何针对特定输入图像尺寸的网络进行指定和设计？

或者在另一篇论文中，他们有以下设计：

他们提到，对于一个256x256的输入图像，网络的总下采样因子为4，导致64x64xL数组，其中L是类标签的数量。这个64x64的大小是如何得到的？

我该如何学习设计网络和计算层的输入/输出？

感谢任何帮助。

- S.EB

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Shai · Accepted Answer

如果您使用 stride=2 进行两次池化，意味着您将图像大小缩小了两倍，总共缩小了4倍 (子采样)。因此，如果您从大小为256的图像开始：256/4=64。
如何选择卷积核大小、每层输出的数量、步长和其他设计参数？实际上没有一个单一的答案，许多论文/作品使用不同的设置来处理相同的任务。据我所知，并没有明确的指导方针或适用于任何特定任务的明显参数选择。
尽管如此，您可以找到这个工作调查一些新兴的深度网络设计模式。