我想在Keras NN模型中使用一些由Google在一篇非常著名的文章中发布的预训练词向量。他们提供了训练新模型的代码以及嵌入 这里。
然而,文档不清楚如何通过一个简单的Python函数调用从给定的字符(单词)中检索嵌入向量。文档中很多内容似乎集中于将向量倾入整个句子的文件,可能是为了情感分析。
到目前为止,我已经看到可以使用以下语法来输入预训练的嵌入:
embedding_layer = Embedding(number_of_words??,
out_dim=128??,
weights=[pre_trained_matrix_here],
input_length=60??,
trainable=False)
然而,将不同的文件及其结构转换为pre_trained_matrix_here
对我来说并不是很清楚。
它们有几个softmax输出,所以我不确定哪一个属于它们 - 而且如何将我的输入中的单词与它们拥有的单词字典对齐也不确定。
是否有一种简单的方法在keras中使用这些单词/字符嵌入和/或构建keras模型中的字符/单词嵌入部分,以便可以添加其他NLP任务的层?