Twitter(社交网络)数据集

15

我正在寻找Twitter或其他社交网络网站的数据集,用于我的项目。我目前有CAW 2.0 Twitter数据集,但它只包含用户的推文。我需要一个能够显示朋友数、关注者等信息的数据。

它不一定是Twitter,但我更喜欢Twitter或Facebook。我已经尝试了Infochimps,但显然Twitter的文件已不能下载。

有人能提供好的网站来寻找这种数据集吗?我将把数据集输入Hadoop中。

4个回答

7

请尝试以下三个数据集:

包含约9700万条推文:

http://demeter.inf.ed.ac.uk/index.php?option=com_content&view=article&id=2:test-post-for-twitter&catid=1:twitter&Itemid=2

:由于Twitter的要求,上述链接已不再提供。

包含4700万用户的用户图:

http://an.kaist.ac.kr/traces/WWW2010.html

以下数据集既包含网络也包含推文,但数据是通过雪球取样之类的方式收集的,因此朋友网络不是均匀的。它包含约1000万条推文,您可以向研究人员发送电子邮件以获取更多数据。

http://www.public.asu.edu/~mdechoud/datasets.html

请注意数据的许可证。

希望这能有所帮助, 同时,您能告诉我打算用这个数据集做什么工作吗? 我有一些用于数据集的Hadoop / Pig脚本。


1
@Akshay Bhat:今天他们似乎已经删除了数据集。您是否知道其他可能可用的数据集?谢谢! - Legend

5

1
顺便提一下,还有一个 Twitter API。 - Guillaume Lebourgeois
奇怪,我没有赢得赏金。 - user408847

2

1

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接