我已经有了一个tf-idf矩阵,其中行代表术语,列代表文档。现在我想用给定的术语-文档矩阵训练LDA模型。第一步似乎是使用
gensim.matutils.Dense2Corpus
将矩阵转换为语料库格式。但如何构建id2word
参数呢?我有术语列表(#terms==#rows),但不知道词典的格式,因此无法从gensim.corpora.Dictionary.load_from_text
等函数中构建词典。有什么建议吗?谢谢。