24得票1回答
将pyLDAvis图表导出为独立的网页

我正在使用Gensim和pyLDAvis进行主题模型分析文本。希望能够与远程同事分享结果,而无需安装Python和所有必需的库。是否有一种将交互式图表导出为HTML/JS文件的方法,以便上传到任何Web服务器? 我在文档中找到了相关提及,但不知道如何实现: https://github.com...

19得票3回答
使用topicmodels的LDA模型,如何查看不同文档属于哪些主题?

我正在使用topicmodels包中的LDA,并对约30,000个文件运行它,得到了30个主题,并获得了每个主题的前10个单词,它们看起来非常好。但我想知道哪些文档属于具有最高概率的哪个主题,我该如何做?myCorpus <- Corpus(VectorSource(userbios$b...

9得票4回答
Gensim:如何将LDA模型生成的主题保存为可读格式(csv、txt等)?

代码的最后一部分: lda = LdaModel(corpus=corpus,id2word=dictionary, num_topics=2) print lda Bash 输出: INFO : adding document #0 to Dictionary(0 unique to...

7得票2回答
scikit-learn的LDA函数中存在bug - 图表显示非零相关性

我使用scikit-learn的LDA函数进行了一些LDA,并注意到我的结果图中LD之间存在非零相关性。 from sklearn.lda import LDA sklearn_lda = LDA(n_components=2) transf_lda = sklearn_lda.fit_tr...

8得票4回答
WordCloud仅支持TrueType字体。

我正在尝试使用Python中的WordCloud模块生成词云,但是每当我调用.generate时,我会看到以下错误。 Traceback (most recent call last): File "/mnt/6db3226b-5f96-4257-980d-bb8ec1dad8e7/te...

7得票3回答
pyLDAvis中lambda=0时柱形图条宽的含义

不确定这是否是正确的论坛,但我想知道是否有人了解如何解释当lambda = 0时pyLDAvis图表右侧的红色和蓝色条的宽度(请参见http://www.kennyshirley.com/LDAvis/#topic=0&lambda=0.01&term=进行演示)。我知道当la...

14得票1回答
理解Gensim LDA模型中的参数

我正在使用gensim.models.ldamodel.LdaModel进行LDA,但我不理解其中一些参数,文档中也找不到解释。如果有人有使用经验,我希望能够进一步了解这些参数的含义。 random_state update_every chunksize passes alpha per...

11得票3回答
导入错误:找不到名为'sklearn.lda'的模块。

当我在openface演示目录中运行classifier.py时,使用以下命令:classifier.py train ./generated-embeddings/,我会得到以下错误信息: --> from sklearn.lda import LDA ModuleNotFou...

26得票2回答
LDA在短文本上的缺点是什么?

我试图理解为什么潜在狄利克雷分配(LDA)在Twitter等短文本环境中表现不佳。我已阅读论文“用于短文本的双词主题模型”,但仍不理解“单词共现的稀疏性”。 从我的角度来看,LDA的生成部分对于任何类型的文本都是合理的,但造成短文本结果差的原因是抽样过程。我猜测LDA会基于(1)同一文档中其...

34得票3回答
Python Gensim:如何使用LDA模型计算文档相似度?

我有一个训练好的LDA模型,想要计算从我训练过的语料库中取出的两个文档之间的相似度分数。在学习了所有Gensim教程和函数之后,我仍然无法理解它。有人可以给我一些提示吗?谢谢!