我已经学习了几周的LDA和主题模型。但由于我的数学能力较差,我不能完全理解其内部算法。我使用了GibbsLDA实现,输入了许多文档,并将主题数量设置为100,得到了一个名为“final.theta”的文件,其中存储了每个文档中每个主题的主题比例。这个结果很好,我可以使用主题比例做很多其他的事情。
但是当我尝试使用Blei的C语言实现LDA时,我只得到了一个名为final.gamma的文件,但我不知道如何将这个文件转换成主题比例样式。
有人可以帮助我吗?
我已经了解到LDA模型有许多改进版本(如CTM、HLDA),如果我能找到一个类似LDA的主题模型,也就是说,当我输入大量文档时,它可以直接输出文档中的主题比例。
非常感谢!
但是当我尝试使用Blei的C语言实现LDA时,我只得到了一个名为final.gamma的文件,但我不知道如何将这个文件转换成主题比例样式。
有人可以帮助我吗?
我已经了解到LDA模型有许多改进版本(如CTM、HLDA),如果我能找到一个类似LDA的主题模型,也就是说,当我输入大量文档时,它可以直接输出文档中的主题比例。
非常感谢!