从LDA gensim中检索主题-词数组和文档-主题数组。

Question

5

情况：

我有一个numpy术语文档矩阵示例：[[0,1,0,0....],....[......0,0,0,0]]。

我已经将上述矩阵插入gensim的ldamodel方法中。使用lad方法lda = LdaModel(corpus, num_topics=10)，它可以正常工作。 corpus是我上面提到的术语文档矩阵。出于研究目的，我需要两个中间矩阵（主题 - 词汇数组和文档 - 主题数组）。

1）每个文档 - 主题概率矩阵（p_d_t）

2）每个主题 - 词汇概率矩阵（p_w_t）

问题：

如何从gensim的LdaModel()函数中获取这些矩阵？请帮助我获得这些矩阵。

- AnandViswanathan89

如果你使用 lda.print_topics(k)，它会打印每个单词的概率，并且通过 vec_lda = lda[document]，它会显示每个主题的概率。 - christosh

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- sinwav · Accepted Answer

1.每个文档的主题概率矩阵：

对您的语料库应用变换。

docTopicProbMat = lda[corpus]

K = lda.num_topics topicWordProbMat = lda.print_topics(K)