我最初在Keras中开发了一个分类器,其中我的优化器很容易应用衰减。
adam = keras.optimizers.Adam(decay=0.001)
最近我尝试将整个代码更改为纯Tensorflow,但无法弄清如何正确地将相同的衰减机制应用于我的优化器。
optimizer = tf.train.AdamOptimizer()
train_op = optimizer.minimize(loss=loss,global_step=tf.train.get_global_step())
如何将Keras代码段中的相同学习率衰减应用于我的Tensorflow代码段?