我使用tf/idf计算两个文档之间的余弦相似度。它有一些限制,并且表现不太好。
我寻找LDA(潜在狄利克雷分配)来计算文档相似性,但我对此并不了解。我也没有找到关于我的问题的太多资料。
您能否提供与我的问题相关的任何教程?或者您能否给出一些建议,如何使用LDA完成此任务?
谢谢。
附注:是否有任何源代码可用于使用LDA执行此类任务?
我寻找LDA(潜在狄利克雷分配)来计算文档相似性,但我对此并不了解。我也没有找到关于我的问题的太多资料。
您能否提供与我的问题相关的任何教程?或者您能否给出一些建议,如何使用LDA完成此任务?
谢谢。
附注:是否有任何源代码可用于使用LDA执行此类任务?