所以我有一个RNN编码器,它是更大的语言模型的一部分。其中过程为:编码 -> rnn -> 解码。
作为我的rnn类的__init__
的一部分,我有以下内容:
self.encode_this = nn.Embedding(self.vocab_size, self.embedded_vocab_dim)
现在我正在尝试实现一个前向类,它接收批次数据,执行编码然后解码。
def f_calc(self, batch):
#Here, batch.shape[0] is the size of batch while batch.shape[1] is the sequence length
hidden_states = (torch.zeros(self.num_layers, batch.shape[0], self.hidden_vocab_dim).to(device))
embedded_states = (torch.zeros(batch.shape[0],batch.shape[1], self.embedded_vocab_dim).to(device))
o1, h = self.encode_this(embedded_states)
然而,我的问题始终与编码器有关,这给了我以下错误:
/usr/local/lib/python3.6/dist-packages/torch/nn/functional.py in embedding(input, weight, padding_idx, max_norm, norm_type, scale_grad_by_freq, sparse)
1465 # remove once script supports set_grad_enabled
1466 _no_grad_embedding_renorm_(weight, input, max_norm, norm_type)
-> 1467 return torch.embedding(weight, input, padding_idx, scale_grad_by_freq, sparse)
1468
1469
RuntimeError: Expected tensor for argument #1 'indices' to have scalar type Long; but got torch.cuda.FloatTensor instead (while checking arguments for embedding)
任何人有任何想法如何解决吗?我完全不熟悉pytorch,所以如果这是一个愚蠢的问题,请原谅我。我知道涉及到某种类型转换,但我不确定如何去做...非常感谢!