在生成训练数据时,会计算出一个平均图像(而不是每个通道的平均像素值)。
为了改善学习过程,我想应用一种简化方法来对网络输入数据进行零中心化和归一化处理,这些数据主要由RGB图像组成。
作为一个深度学习框架,我使用Keras——按照这里描述的方法加载训练数据tfrecords文件。
在我的加载管道的某个阶段,我有输入(X)和输出(Y)张量:
为了改善学习过程,我想应用一种简化方法来对网络输入数据进行零中心化和归一化处理,这些数据主要由RGB图像组成。
image = (image - meanImage + 1.0) / 2.0
作为一个深度学习框架,我使用Keras——按照这里描述的方法加载训练数据tfrecords文件。
在我的加载管道的某个阶段,我有输入(X)和输出(Y)张量:
def datasetLoader(dataSetPath, batchSize):
dataset = tf.data.TFRecordDataset(dataSetPath)
dataset = dataset.map(_ds_parser, num_parallel_calls=8)
# This dataset will go on forever
dataset = dataset.repeat()
# Set the batchsize
dataset = dataset.batch(batchSize)
# Create an iterator
iterator = dataset.make_one_shot_iterator()
# Create your tf representation of the iterator
X, Y = iterator.get_next()
# Bring the date back in shape
X = tf.reshape(I, [-1, 66, 198, 3])
Y = tf.reshape(Y,[-1,1])
return X, Y
变量X和Y只是张量,在后面的tensorflow会话中填充。
问题是:我如何使用我的本地png均值图像来执行零中心化和归一化任务?