我想对短文本进行主题建模。我研究了一些LDA的资料,发现它不太适合处理短文本。有哪些更好的方法可以使用,并且它们是否有Python实现?
我想对短文本进行主题建模。我研究了一些LDA的资料,发现它不太适合处理短文本。有哪些更好的方法可以使用,并且它们是否有Python实现?
这是我最近写的一个非常快速且易于使用的GSDMM实现,可以在Python中使用:https://github.com/centre-for-humanities-computing/tweetopic。我发现现有的实现在性能方面相当缺乏,而这个实现通常比gsdmm快60倍,文档更好,并且完全兼容sklearn。