tf.nn.max_pool的ksize参数是用来指定池化窗口大小的。

21
tf.nn.max_pool的定义中,ksize有什么用处?
tf.nn.max_pool(value, ksize, strides, padding, data_format='NHWC', name=None)

Performs the max pooling on the input.

Args:

value: A 4-D Tensor with shape [batch, height, width, channels] and type    tf.float32.
ksize: A list of ints that has length >= 4. The size of the window for each dimension of the input tensor.
例如,如果一个是张量:[1, 64, 64, 3]ksize=3。那是什么意思呢?

它在大小为ksize(核大小)的区域内取最大值。 - Olivier Moindrot
根据描述,ksize捕获输入张量每个维度的窗口大小。如果批处理大小=6,ksize = 3,那么对于给定的池化核,最大值是否将在3个批次中取得? - user288609
1个回答

50

根据文档说明:

ksize: 一个长度大于等于4的整数列表,表示输入张量每个维度的窗口大小。

对于图像而言,一般输入的形状为[batch_size, 64, 64, 3],其中64x64像素的RGB图像。

如果使用2x2窗口进行最大池化操作,则ksize通常为[1, 2, 2, 1]。在批处理尺寸和通道尺寸上,ksize1,因为我们不想在多个示例或多个通道上取最大值。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接