很抱歉回答晚了,但这个答案适用于任何面临相同问题的人。
首先,如果缩放并改变宽高比会影响某些重要特征,则必须使用零填充。
零填充不会因为大黑区域本身而使网络学习时间更长,而是因为未填充图像在填充后可能出现的不同位置。因为可以用多种方式对图像进行填充。
对于零像素区域,卷积操作的输出为零。最大或平均池化也是一样。此外,您可以证明在某些激活函数(例如relu、sigmoid)下,如果与该权重相关联的输入为零,则在反向传播后权重不会被更新。因此,从这个意义上说,大面积不会对权重进行任何更新。
然而,未填充图像相对填充图像的位置确实会影响训练。这不是由于卷积层或池化层,而是由于最后一个完全连接的层。例如,如果未填充图像相对于填充图像的左侧,且展平最后一个卷积或池化层的输出为[1,0,0],而相同未填充图像相对于填充图像的右侧,展平后的输出为[0,0,1],则完全连接的层必须学习[1,0,0]和[0,0,1]是分类问题中相同的东西。
因此,学习图像不同可能位置的等变性会使训练时间更长。如果你有100万张图片,那么在调整大小后你将拥有相同数量的图片;另一方面,如果你要填充并考虑不同可能的位置(每张图片随机选取10个),那么你将拥有1000万张图片。也就是说,训练将需要10倍的时间。
尽管如此,这取决于您的问题和想要实现的目标。此外,测试两种方法都不会有坏处。