我能否在输入层后立即使用批量归一化层而不对我的数据进行归一化? 我是否可以期望获得类似的效果/性能?
在Keras functional中,它可能是这样的:
x = Input (...)
x = Batchnorm(...)(x)
...
我能否在输入层后立即使用批量归一化层而不对我的数据进行归一化? 我是否可以期望获得类似的效果/性能?
在Keras functional中,它可能是这样的:
x = Input (...)
x = Batchnorm(...)(x)
...
你可以这样做。但是,除了激活分布稳定之外,批量归一化的好处在于,随着网络学习,均值和标准差很可能会迁移。
实际上,在输入层后面设置批量归一化是一种花哨的数据预处理步骤。有时很有帮助(例如在线性回归中),但计算整个训练样本的均值和方差比逐批次学习更容易、更有效率。请注意,批量归一化在性能方面并非免费的,不应滥用。