145得票14回答
如何使用gensim库的word2vec模型和Python计算句子相似度

根据 Gensim Word2Vec,我可以使用 gensim 包中的 word2vec 模型来计算 2 个单词之间的相似度。 例如:trained_model.similarity('woman', 'man') 0.73723527 然而,word2vec模型无法预测句子的相似性。我在...

68得票10回答
将word2vec二进制文件转换为文本

我可以从word2vec网站上下载GoogleNews-vectors-negative300.bin.gz文件。.bin文件(约3.4GB)是一种对我没有用的二进制格式。Tomas Mikolov 向我们保证,“将二进制格式转换为文本格式应该相当简单(尽管需要更多的磁盘空间)。检查距离工具中...

58得票4回答
Doc2vec: 如何获取文档向量

如何使用Doc2vec获取两个文本文档的文档向量?我是新手,希望有人能指点我方向/提供一些教程。我正在使用gensim。doc1=["This is a sentence","This is another sentence"] documents1=[doc.strip().split(" ...

55得票1回答
gensim Doc2Vec与tensorflow Doc2Vec的比较

我正在尝试比较我的Doc2Vec实现(通过tf)和gensim的实现。至少从视觉上看,gensim的表现更好。 我运行了以下代码以训练gensim模型,下面的代码用于tensorflow模型。我的问题如下: 我的Doc2Vec tf实现是否正确?基本上,它是否应该将单词向量和文档向量连接...

54得票5回答
gensim word2vec:找到词汇表中的单词数量

在使用Python gensim训练完一个word2vec模型后,如何查找该模型词汇表中单词的数量?

52得票6回答
PyTorch / Gensim - 如何加载预训练的词嵌入?

我想用gensim将预训练的word2vec嵌入加载到PyTorch嵌入层中。 如何将gensim加载的嵌入权重加载到PyTorch嵌入层中?

50得票19回答
gensim错误:导入错误:没有名为'gensim'的模块。

我正在尝试使用以下代码导入gensim:import gensim 但是出现了以下错误ImportError Traceback (most recent call last) <ipython-input-5-50007b...

48得票5回答
如何在Python中从语料库创建词云?

从在 R 中从语料库创建单词子集中,答案提供者可以轻松将一个term-document matrix转换为一个单词云。 是否有类似的Python库函数,可以将原始单词文本文件或NLTK语料库或Gensim Mmcorpus转换为单词云? 结果将看起来像这样:

47得票5回答
如何使用pandas dataframe获取tfidf?

我想从以下文件计算tf-idf。我正在使用Python和Pandas。import pandas as pd df = pd.DataFrame({'docId': [1,2,3], 'sent': ['This is the first sentence','...

46得票4回答
如何使用预训练的词向量来使用Gensim doc2vec?

我最近了解到Gensim中的doc2vec功能。如何使用预训练的单词向量(例如在word2vec原始网站上找到的向量)与doc2vec一起使用? 还是说doc2vec从用于段落向量训练的相同句子中获取单词向量? 谢谢。