我在理论上理解了CNN层操作中最大/求和池化的概念,但我看到这个术语“随时间最大池化”或“随时间求和池化”被抛出(例如,Yoon Kim的“用于句子分类的卷积神经网络”论文)。它们之间有什么区别?
我在理论上理解了CNN层操作中最大/求和池化的概念,但我看到这个术语“随时间最大池化”或“随时间求和池化”被抛出(例如,Yoon Kim的“用于句子分类的卷积神经网络”论文)。它们之间有什么区别?
max_c=max(c)
,即它是整个特征映射的最大值。之所以这样做,而不是像在CNN中那样“下采样”句子,是因为在NLP中,语料库中的句子自然具有不同的长度。这使得不同句子的特征映射不同,但我们希望将张量缩小到固定大小,以便在最后应用softmax或回归头。正如论文中所述,它允许捕获最重要的特征,即每个特征映射中具有最高值的特征。28x28
或32x32
,因此无需立即将特征映射下采样到1x1
。1现代卷积神经网络可以使用不同尺寸的图像进行训练,但这需要网络是全卷积的,因此它没有任何池化层。有关更多详细信息,请参见此问题。
最大池化通常应用于2D特征平面中的区域,而沿着1D特征向量进行时间上的最大池化。
以下是斯坦福CS231n关于最大池化的演示:
最大时间池化是对一维特征向量进行计算,取其中的最大值。 "over time" 表示这是在某些序列输入(如句子或来自句子所有短语的串联)沿时间维度发生的。例如:[2, 7, 4, 1, 5] -> [7]