我有一个非常大的tensorflow
图,还有两组变量:A和B。我创建了两个优化器:
learning_rate = 1e-3
optimizer1 = tf.train.AdamOptimizer(learning_rate).minimize(loss_1, var_list=var_list_1)
optimizer2 = tf.train.AdamOptimizer(learning_rate).minimize(loss_2, var_list=var_list_2)
这里的目标是迭代地优化变量1和变量2。变量2的权重用于计算损失1,但在优化损失1时它们不可训练。同时,变量1的权重在优化损失2时不被使用(我认为这是一个关键性的不对称点)。
奇怪的是,我发现优化optimizer2
要比仅仅单独优化图表中的那一部分慢得多(2倍)。我没有运行任何摘要。
为什么会出现这种现象?我该如何解决?如果需要,我可以提供更多细节。