在Tensorflow 2.0中,有一个称为{{loss function}}的损失函数。
我能问一下,设置from_logits = True或False有什么区别吗? 我的猜测是,当传入的值是logits时,您设置from_logits = True,如果传入的值是概率(由softmax等输出),则将其设置为from_logits = False(这是默认设置)。
但是为什么?损失只是一些计算。为什么它需要根据传入的值而不同? 我还在谷歌的tensorflow教程中看到了这个问题https://www.tensorflow.org/alpha/tutorials/sequences/text_generation,即使最后一层的传入值是logits,它也没有将from_logits = True设置为True。 以下是代码
tf.keras.losses.sparse_categorical_crossentropy(labels, targets, from_logits = False)
我能问一下,设置from_logits = True或False有什么区别吗? 我的猜测是,当传入的值是logits时,您设置from_logits = True,如果传入的值是概率(由softmax等输出),则将其设置为from_logits = False(这是默认设置)。
但是为什么?损失只是一些计算。为什么它需要根据传入的值而不同? 我还在谷歌的tensorflow教程中看到了这个问题https://www.tensorflow.org/alpha/tutorials/sequences/text_generation,即使最后一层的传入值是logits,它也没有将from_logits = True设置为True。 以下是代码
@tf.function
def train_step(inp, target):
with tf.GradientTape() as tape:
predictions = model(inp)
loss = tf.reduce_mean(
tf.keras.losses.sparse_categorical_crossentropy(target, predictions))
grads = tape.gradient(loss, model.trainable_variables)
optimizer.apply_gradients(zip(grads, model.trainable_variables))
return loss
模型所在位置
model = tf.keras.Sequential([
tf.keras.layers.Embedding(vocab_size, embedding_dim,
batch_input_shape=[batch_size, None]),
tf.keras.layers.LSTM(rnn_units,
return_sequences=True,
stateful=True,
recurrent_initializer='glorot_uniform'),
tf.keras.layers.Dense(vocab_size)
])
该模型没有最后一层softmax。(另外,在教程的另一个部分中,它将from_logits设置为True)
那么,我是否需要将其设置为True呢?
from_logits=True
。 - Saeed Masoomi