在大多数架构中,卷积层之后都会跟着一个池化层(最大值/平均值等)。由于这些池化层只是选择前一层(即卷积层)的输出,我们是否可以仅使用步幅为2的卷积来减少处理需求,并期望获得类似的准确性结果?
在大多数架构中,卷积层之后都会跟着一个池化层(最大值/平均值等)。由于这些池化层只是选择前一层(即卷积层)的输出,我们是否可以仅使用步幅为2的卷积来减少处理需求,并期望获得类似的准确性结果?
可以做到这一点。在论文“追求简单:全卷积网络”'Striving for simplicity: The all convolutional net'
中有详细解释。https://arxiv.org/pdf/1412.6806.pdf。引用论文中的话:
“我们发现,在几个图像识别基准测试中,最大池化层可以通过增加步幅的卷积层来替换,而不会损失精度。”