我是卷积神经网络的新手,只知道特征图和卷积在图像上提取特征的想法。我希望了解有关在CNN中应用批归一化的详细信息。
我阅读了这篇论文https://arxiv.org/pdf/1502.03167v3.pdf,并且能够理解BN算法应用于数据,但最后他们提到在应用到CNN时需要进行轻微修改:
对于卷积层,我们还希望规范化遵守卷积属性-以便在同一特征图的不同位置的不同元素以相同方式进行规范化。为了实现这一点,我们联合规范化小批量中所有位置上的所有激活。在Alg. 1中,我们让B成为跨越小批量元素和空间位置的特征图中所有值的集合-因此对于大小为p×q的特征映射和大小为m的小批量,我们使用有效小批量大小 m' = |B| = m · pq。我们每个特征映射学习一对参数γ(k)和β(k),而不是每个激活学习一对参数。类似地,Alg. 2进行了修改,因此在推断期间,BN变换对给定特征图中的每个激活应用相同的线性变换。
当他们说"这样可以使同一特征图的不同位置上的不同元素以相同方式进行规范化"时,我完全感到困惑。
我知道什么是特征图,不同的元素是每个特征图中的权重。但是我无法理解位置或空间位置的含义。
我完全无法理解以下句子"在Alg. 1中,我们让B成为跨越小批量元素和空间位置的特征图中所有值的集合"。
如果有人能详细说明并用更简单的术语解释给我就太好了。