我对从不同的Reddit子论坛获取数据很感兴趣。请问是否有Reddit/其他API类似于Twitter,可以爬取所有页面的数据?
是的,Reddit有一个API可用于各种目的,如数据收集、自动评论机器人,甚至协助子版块管理。
有几个地方可以了解Reddit的API信息:
如果你已经熟悉某个特定的编程语言,你应该查看那些不同语言现有的API包装器。尽管我有偏见(我是软件包维护者),但我相当确定Python的PRAW支持最多的Reddit API功能。
使用 ajax/javascript 解析来自 reddit 的 JSON 数据。
CORS 已启用以进行 GET 请求。
以下是一个示例,解析最近的 视频 以 JSON 格式从 reddit 中获取:
xhr = new XMLHttpRequest
xhr.open("GET","https://www.reddit.com/r/videos/.json",true)
xhr.send(null)
xhr.onreadystatechange = function() {
if(this.status === 200) {
console.log(JSON.parse(xhr.responseText))
}
}
https://developer.mozilla.org/fr/docs/Web/API/XMLHttpRequest
如果想深入了解,请查看以下问题: