search.twitter.com的“热门话题”算法是什么?

10
2个回答

13

Twitter的热门话题算法不仅仅是关键词的数量。这只是其中的一部分,还有一个衰减因素,使得"Justin Bieber"不会永远成为热门话题。

Quora上的一篇帖子支持了这一点。http://www.quora.com/Trending-Topics-Twitter/What-is-the-basis-of-Twitters-current-Trending-Topics-algorithm?q=trending+algorithm

衰减通常是通过在算法中使用帖子的相对年龄来完成的,给予新话题/帖子等更多的权重。

另请参见:http://www.quora.com/What-tools-algorithms-or-data-structures-would-you-use-to-build-a-Trending-Topics-algorithm-for-a-high-velocity-stream?q=trending+algorithm


1

推特可能会做的事情是计算特定术语的提及次数减去停用词(例如:do、me、you、I、not、on等)。因此,“the cat is out of the bag”和“my dog ate my cat”意味着它提取了cat、dog和bag这些术语(其余都是停用词)。然后,它将“cat”计为2个引用,因此在这种情况下,“cat”将成为一个热门话题。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接