一个过滤器是在前一层中所有维度的总和。这意味着5x5的过滤器对32个维度求和,实质上是32*5*5个值的加权和。然而,权重值在维度之间是共享的。然后有64个这样的过滤器。更好的解释可以在这里找到:http://cs231n.github.io/convolutional-networks/。
这里有一个清晰的解释,说明输入大小如何随着层数的增加而变化。
在输入中,您提供的尺寸为28宽度和28高度,深度为1。对于第一层的过滤器,过滤器的深度维必须等于输入的深度维。因此,过滤器的尺寸将是5x5x1,应用一个过滤器后,由于步幅的缘故,维度减少以产生14x14x1维度激活图,因此应用32个这样的过滤器将给您32个激活图。将所有这些14x14x32组合起来就是第1层的输出,并作为第2层的输入。同样,在第二层中,您需要在该层上应用一个5(宽)x5(高)x32(深度)的过滤器,以产生一个14x14x1的激活图,堆叠所有64个激活图将给您第二层的输出尺寸为14x14x64,依此类推。
是的,实际上您在每个32个通道上应用了64个过滤器。