Keras Conv2D:滤波器与内核大小的区别

23

这两者有什么区别?更通俗地讲解一下卷积神经网络的相关概念将有助于回答该问题。

另外,作为一个附注,什么是通道?换句话说,请为我分解以下三个术语:通道、过滤器和卷积核。

1个回答

21
每个卷积层由多个卷积通道(也称为深度或滤波器)组成。在实践中,它们是一些数字,例如 64、128、256、512 等,这相当于卷积层输出的通道数。另一方面,kernel_size 是这些卷积过滤器的大小。在实践中,它们取值如 3x31x15x5。为了简写,它们可以写为 135,因为在实践中它们大多是正方形。

编辑

以下引用应该更加清晰。

在 vlfeat 上的讨论

假设输入 X 的大小为 W x H x D x N(其中 N 是批次大小),输入到网络中包含大小为 FW x FH x FD x K 的过滤器 F 的卷积层中。

特征通道数 D 在此处是输入 X 的第三维(例如,如果输入由彩色图像组成,则通常在网络的第一个输入处为 3)。

滤波器数 KF 的第四个维度。两个概念密切相关,因为如果一层中的过滤器数量为K,则会产生具有K个特征通道的输出。因此,下一层的输入将具有K个特征通道。

FW x FH是您正在寻找的过滤器大小。

补充说明:

你应该熟悉滤波器。你可以认为每个滤镜负责从原始图像中提取某种类型的特征。CNN尝试学习这样的过滤器,即在CNN训练期间对CNN进行参数化的过滤器是可学习的。您可以将每个滤波器应用于Conv2D中的每个输入通道,并组合这些通道以获得输出通道。因此,过滤器数量和输出通道数量相同。


1
通道、滤波器和深度都是指同一件事吗? - Baron Yugovich
1
只是为了确保,上面的FW是一个新的单变量,不像F*W,对吗? - Baron Yugovich
1
是的,FW代表过滤器的宽度,FH代表过滤器的高度。 - Dinesh
所以,在输入中,这3个通道具有明确的含义,即R、G、B值。但在隐藏值中,有时我们会有多于3个通道,它们的含义是什么?此外,单个隐藏神经元中的值是否可以合并来自多个输入通道的值(例如同时包含R和B),或者在卷积过程中输入通道之间没有“混合”? - Baron Yugovich
我修改了上述内容,以便解释筛选器。 - Dinesh

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接