11得票5回答
使用Python可视化LDA模型

我有一份包含10万个文档中最常见的10个主题的LDA模型。现在只有相应概率分布的单词概述。 我想知道是否有适用于Python的工具来可视化这些主题?

11得票3回答
如何使用gensim中训练好的LDA模型来预测新查询的主题?

我已经使用gensim训练了一个语料库,用于LDA主题建模。 按照gensim网站上的教程(这不是完整的代码):question = 'Changelog generation from Github issues?'; temp = question.lower() for i in r...

11得票2回答
如何使用Gensim获取LDA模型的最佳主题数?

我正在尝试在Gensim中获取LDA模型的最佳主题数量。 我发现的一种方法是计算每个模型的对数似然,并将其与其他模型进行比较,例如在使用潜在狄利克雷分配的输入参数上。 因此,我研究了如何使用Gensim计算LDA模型的对数似然,并找到了以下帖子:如何估计潜在狄利克雷分配模型的α参数? 它基...

11得票3回答
导入错误:找不到名为'sklearn.lda'的模块。

当我在openface演示目录中运行classifier.py时,使用以下命令:classifier.py train ./generated-embeddings/,我会得到以下错误信息: --> from sklearn.lda import LDA ModuleNotFou...

10得票1回答
LDA主题模型性能-针对scikit-learn的主题相干实现

我有一个关于在scikit-learn中构建的LDA模型度量/计算主题连贯性的问题。 主题连贯性是衡量给定LDA主题模型的人类可解释性的有用指标。Gensim的CoherenceModel允许计算给定LDA模型的主题连贯性(包括几种变体)。 我有兴趣利用scikit-learn的LDA而不...

10得票6回答
如何在gensim中仅访问主题词

我用Gensim构建了LDA模型,现在只想获取主题词,不需要概率和ID。我尝试过gensim中的print_topics()和show_topics()函数,但是无法获得干净的单词。以下是我使用的代码: 我使用了以下代码:dictionary = corpora.Dictionary(do...

9得票3回答
gensim.interfaces.TransformedCorpus - 如何使用?

我是一个相对新手,在潜在狄利克雷分配领域。 我能够按照维基百科教程生成LDA模型,并能够使用自己的文档生成LDA模型。 现在,我的下一步是尝试了解如何使用先前生成的模型来对未见过的文档进行分类。 我正在使用"lda_wiki_model"进行保存。 id2word =gensim.corpo...

9得票1回答
gensim的LdaMulticore没有使用多进程技术吗?

当我在一台拥有12个核心的机器上运行gensim的LdaMulticore模型时,使用以下命令: lda = LdaMulticore(corpus, num_topics=64, workers=10) 我收到了一个日志消息,内容是: using serial LDA version...

9得票1回答
主题建模 - 将文档分配给前两个主题作为类别标签 - sklearn潜在狄利克雷分配

我现在正在使用LDA(潜在狄利克雷分配)主题建模方法来帮助从一组文档中提取主题。根据下面链接中所理解的,这是一种无监督学习方法,用于将每个文档与提取的主题分类/标记。 使用非负矩阵分解和潜在狄利克雷分配进行主题提取 在该链接中给出的示例代码中,定义了一个函数来获取与每个识别出的主题相关联的...

9得票2回答
Spark中LDA模型的在线学习

有没有一种方法可以以在线学习的方式训练LDA模型,即加载先前训练的模型,并使用新文档进行更新?