得票数最多 'word-embedding' 问题 - 第2页

关联标签

24得票3回答

从Gensim 3.8.0升级到Gensim 4.0.0

我已经使用Gensim 3.8.0训练了一个Word2Vec模型。后来，我尝试在GCP上使用Gensim 4.0.o预训练的模型。我使用了以下代码：model = KeyedVectors.load_word2vec_format(wv_path, binary= False) words =...

pythonnlpgensimword2vecword-embedding

23得票2回答

请用示例解释Keras中的嵌入层是如何工作的。

我不太理解Keras的嵌入层。虽然有很多文章对此进行了解释，但我仍然感到困惑。例如，下面的代码是从IMDb情感分析中提取出来的： top_words = 5000 max_review_length = 500 embedding_vecor_length = 32 model =...

pythonmachine-learningkerasneural-networkword-embedding

23得票6回答

词向量中的维度是什么？

我想了解“词嵌入”中的“维数(dimensionality)”指的是什么。在将一个单词以矩阵形式嵌入到自然语言处理任务中时，维数有什么作用？是否有可视化的示例可以帮助我理解这个概念?

nlpterminologydimensionality-reductionword-embedding

22得票4回答

使用LSTM教程代码来预测句子中的下一个单词？

我一直在努力理解示例代码，您可以在https://www.tensorflow.org/tutorials/recurrent找到，也可以在https://github.com/tensorflow/models/blob/master/tutorials/rnn/ptb/ptb_word_l...

pythontensorflowlstmword2vecword-embedding

22得票2回答

词汇量和嵌入维度之间的首选比例是多少？

当使用例如gensim，word2vec或类似的方法来训练嵌入向量时，我想知道嵌入维度与词汇量之间是否有一个好的比例或首选比例？随着更多数据的出现，这会如何变化？还有，在训练嵌入向量时，如何选择一个好的窗口大小？我问这个问题是因为我没有用真实的语言词典来训练我的网络，而是句子描述了进程...

machine-learningkerasnltkword-embeddingnltk-trainer

21得票4回答

word2vec - 最佳方法是什么？添加、连接还是平均词向量？

我正在开发一个循环语言模型。为了学习可用于初始化语言模型的词向量，我使用gensim的word2vec模型。训练完成后，word2vec模型为词汇表中的每个单词保存两个向量: 单词嵌入 (输入/隐藏矩阵的行) 和上下文嵌入(隐藏/输出矩阵的列)。正如这篇文章所述，至少有三种常见的方法来...

pythonword2vecgensimword-embeddinglanguage-model

19得票1回答

为什么在gensim word2vec中会创建多个模型文件？

当我尝试创建一个word2vec模型（跳字模型与负采样）时，我收到了以下3个文件作为输出。 word2vec (File) word2vec.syn1nef.npy (NPY file) word2vec.wv.syn0.npy (NPY file) 我只是担心为什么会出现这种情况，因为在我...

pythonword2vecgensimword-embedding

18得票2回答

使用Keras从lm_1b中生成字符-单词嵌入

我想在Keras NN模型中使用一些由Google在一篇非常著名的文章中发布的预训练词向量。他们提供了训练新模型的代码以及嵌入这里。然而，文档不清楚如何通过一个简单的Python函数调用从给定的字符（单词）中检索嵌入向量。文档中很多内容似乎集中于将向量倾入整个句子的文件，可能是为了情感分...

machine-learningnlpkeraslanguage-modelword-embedding

17得票2回答

加权词嵌入是什么意思？

我试图实现的论文中提到：本研究使用三种类型的文本表示模型对推特进行建模。第一种是由tf-idf（词频 - 逆文档频率）加权的词袋模型（第2.1.1节）。第二种通过对所有单词（在句子中）的词嵌入求平均，来表示一个句子；第三种则是通过对所有单词的加权词嵌入求平均，其中每个单词的权重由tf...

machine-learningnlpword2vectf-idfword-embedding

16得票1回答

Keras 1D卷积层如何与词嵌入一起工作 - 文本分类问题？（过滤器，核大小和所有超参数）

我目前正在使用Keras开发一个文本分类工具。它可以正常工作（表现良好，我达到了98.7的验证准确率），但我无法理解1D卷积层在文本数据中的具体工作原理。我应该使用哪些超参数呢？以下是我的输入数据：句子中的最大单词数：951个（如果少于这个数，会添加填充）词汇量大小：约3200...

pythontensorflowkerasconv-neural-networkword-embedding