127得票10回答
无法从'sklearn.externals'导入名称为'joblib'的模块。

我正在尝试使用joblib从s3加载我的保存模型 import pandas as pd import numpy as np import json import subprocess import sqlalchemy from sklearn.externals import job...

55得票1回答
gensim Doc2Vec与tensorflow Doc2Vec的比较

我正在尝试比较我的Doc2Vec实现(通过tf)和gensim的实现。至少从视觉上看,gensim的表现更好。 我运行了以下代码以训练gensim模型,下面的代码用于tensorflow模型。我的问题如下: 我的Doc2Vec tf实现是否正确?基本上,它是否应该将单词向量和文档向量连接...

46得票4回答
如何使用预训练的词向量来使用Gensim doc2vec?

我最近了解到Gensim中的doc2vec功能。如何使用预训练的单词向量(例如在word2vec原始网站上找到的向量)与doc2vec一起使用? 还是说doc2vec从用于段落向量训练的相同句子中获取单词向量? 谢谢。

44得票1回答
获取最相似的文档(Doc2Vec)

我正在尝试构建一个文档检索模型,它可以按照与查询或搜索字符串相关性最高的顺序返回大多数文档。为此,我使用 gensim 中的 Doc2Vec 模型训练了一个 doc2vec 模型。我的数据集以每行一个字符串的形式存储在 pandas 数据集中。这是我目前的代码:import gensim, r...

17得票2回答
有预训练的doc2vec模型吗?

是否有一个预训练的doc2vec模型,使用类似于维基百科或类似的大型数据集?

17得票3回答
如何在gensim中使用TaggedDocument?

我有两个目录,想要读取它们的文本文件并打标签,但我不知道如何通过TaggedDocument实现。我以为应该像这样工作TaggedDocument([Strings],[Labels]) ,但显然这不起作用。 这是我的代码: from gensim import models from g...

15得票2回答
gensim 如何计算 doc2vec 段落向量

我正在阅读这篇论文:http://cs.stanford.edu/~quocle/paragraph_vector.pdf 该论文提到: “段落向量和单词向量被平均或连接起来,用于预测上下文中的下一个单词。在实验中,我们使用连接作为合并向量的方法。” 那么连接和平均是如何工作的呢...

13得票1回答
如何将对话数据拆分成(上下文,回复)的一对

我正在使用Gensim Doc2Vec模型,尝试对客户支持对话的部分进行聚类。我的目标是为支持团队提供自动回复建议。图1:显示了一个示例对话,在下一个对话线中回答用户问题,使得数据提取变得容易: 在对话期间,“hello”和“我们的办公室位于纽约”应该被建议图2:描述了一个问题和答案不同步的对...

12得票2回答
Doc2Vec.infer_vector在一个特定的训练模型上每次都提供不同的结果。

我试图遵循官方的Doc2Vec Gensim教程,链接在这里-https://github.com/RaRe-Technologies/gensim/blob/develop/docs/notebooks/doc2vec-lee.ipynb。我修改了笔记本电脑第10行中的代码,以确定给定查询的...

10得票1回答
如何在gensim.doc2vec中使用infer_vector?

def cosine(vector1,vector2): cosV12 = np.dot(vector1, vector2) / (linalg.norm(vector1) * linalg.norm(vector2)) return cosV12 model=gensim.m...