从LDA gensim中检索主题-词数组和文档-主题数组。

5

情况:

我有一个numpy术语文档矩阵示例:[[0,1,0,0....],....[......0,0,0,0]]。

我已经将上述矩阵插入gensim的ldamodel方法中。使用lad方法lda = LdaModel(corpus, num_topics=10),它可以正常工作。 corpus是我上面提到的术语文档矩阵。出于研究目的,我需要两个中间矩阵(主题 - 词汇数组和文档 - 主题数组)。

1)每个文档 - 主题概率矩阵(p_d_t)

2)每个主题 - 词汇概率矩阵(p_w_t)

问题:

如何从gensim的LdaModel()函数中获取这些矩阵?请帮助我获得这些矩阵。


如果你使用 lda.print_topics(k),它会打印每个单词的概率,并且通过 vec_lda = lda[document],它会显示每个主题的概率。 - christosh
1个回答

10

1.每个文档的主题概率矩阵:

对您的语料库应用变换

docTopicProbMat = lda[corpus]
  1. 每个主题的单词概率矩阵:

K = lda.num_topics topicWordProbMat = lda.print_topics(K)


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接