24得票3回答
从Gensim 3.8.0升级到Gensim 4.0.0

我已经使用Gensim 3.8.0训练了一个Word2Vec模型。后来,我尝试在GCP上使用Gensim 4.0.o预训练的模型。我使用了以下代码:model = KeyedVectors.load_word2vec_format(wv_path, binary= False) words =...

23得票2回答
请用示例解释Keras中的嵌入层是如何工作的。

我不太理解Keras的嵌入层。虽然有很多文章对此进行了解释,但我仍然感到困惑。例如,下面的代码是从IMDb情感分析中提取出来的: top_words = 5000 max_review_length = 500 embedding_vecor_length = 32 model =...

23得票6回答
词向量中的维度是什么?

我想了解“词嵌入”中的“维数(dimensionality)”指的是什么。 在将一个单词以矩阵形式嵌入到自然语言处理任务中时,维数有什么作用?是否有可视化的示例可以帮助我理解这个概念?

22得票4回答
使用LSTM教程代码来预测句子中的下一个单词?

我一直在努力理解示例代码,您可以在https://www.tensorflow.org/tutorials/recurrent找到,也可以在https://github.com/tensorflow/models/blob/master/tutorials/rnn/ptb/ptb_word_l...

22得票2回答
词汇量和嵌入维度之间的首选比例是多少?

当使用例如gensim,word2vec或类似的方法来训练嵌入向量时,我想知道嵌入维度与词汇量之间是否有一个好的比例或首选比例?随着更多数据的出现,这会如何变化? 还有,在训练嵌入向量时,如何选择一个好的窗口大小? 我问这个问题是因为我没有用真实的语言词典来训练我的网络,而是句子描述了进程...

21得票4回答
word2vec - 最佳方法是什么?添加、连接还是平均词向量?

我正在开发一个循环语言模型。为了学习可用于初始化语言模型的词向量,我使用gensim的word2vec模型。 训练完成后,word2vec模型为词汇表中的每个单词保存两个向量: 单词嵌入 (输入/隐藏矩阵的行) 和 上下文嵌入(隐藏/输出矩阵的列)。 正如这篇文章所述,至少有三种常见的方法来...

19得票1回答
为什么在gensim word2vec中会创建多个模型文件?

当我尝试创建一个word2vec模型(跳字模型与负采样)时,我收到了以下3个文件作为输出。 word2vec (File) word2vec.syn1nef.npy (NPY file) word2vec.wv.syn0.npy (NPY file) 我只是担心为什么会出现这种情况,因为在我...

18得票2回答
使用Keras从lm_1b中生成字符-单词嵌入

我想在Keras NN模型中使用一些由Google在一篇非常著名的文章中发布的预训练词向量。他们提供了训练新模型的代码以及嵌入 这里。 然而,文档不清楚如何通过一个简单的Python函数调用从给定的字符(单词)中检索嵌入向量。文档中很多内容似乎集中于将向量倾入整个句子的文件,可能是为了情感分...

17得票2回答
加权词嵌入是什么意思?

我试图实现的论文中提到: 本研究使用三种类型的文本表示模型对推特进行建模。第一种是由tf-idf(词频 - 逆文档频率)加权的词袋模型(第2.1.1节)。第二种通过对所有单词(在句子中)的词嵌入求平均,来表示一个句子;第三种则是通过对所有单词的加权词嵌入求平均,其中每个单词的权重由tf...

16得票1回答
Keras 1D卷积层如何与词嵌入一起工作 - 文本分类问题?(过滤器,核大小和所有超参数)

我目前正在使用Keras开发一个文本分类工具。它可以正常工作(表现良好,我达到了98.7的验证准确率),但我无法理解1D卷积层在文本数据中的具体工作原理。 我应该使用哪些超参数呢? 以下是我的输入数据: 句子中的最大单词数:951个(如果少于这个数,会添加填充) 词汇量大小:约3200...