Tweepy API 搜索结果和速率限制

3

我是Python和Tweepy的新手,已经使用它一段时间了。我发现这个代码片段由gumption提供。我一直在使用它来填充Excel文件中的推文,效果很好。

但我有几个问题:使用这个循环可以获取多少条推文?或者更具体地说,当我获取最近几天的前2000条推文时,这些都是我搜索的标签发布的所有推文吗?还是与流API相同,我只能获取1%的所有推文?

而且我不太明白我的速率限制。使用上述代码获取10000条推文需要多少查询?每页100条推文,因此需要100页=100个查询吗?

1个回答

9
当我获取过去2000条推文时,它们是否都是我搜索的标签发表的所有推文?还是与Stream API相同,我只能获取所有推文的1%?
都不是。Twitter 只提供过去两周内的推文。但是,对于所有关键字都不同:
引用: 搜索 API 不是所有推文的完整索引,而是最近推文的索引。目前,该索引包括6-9天的推文。
此外,并非保证 Twitter 搜索 API 索引了所有最新的推文:
引用: 需要知道的是,搜索 API 关注的是相关性而不是完整性。这意味着一些推文和用户可能在搜索结果中缺失。
这些信息来自Twitter 搜索 API 的普通信息页面,读起来很好,可以回答很多问题。
我不太理解我的速率限制。使用上述代码需要查询多少次才能获取 10,000 条推文?
Twitter API有一个图表,用于说明不同资源的速率限制。速率限制以15分钟为一个时间段。对于搜索,每个15分钟窗口内,您可以进行180次请求。由于每个请求可以获取100个推文,理论上您可以在15分钟内获取18k条推文。然而,您只能收集 Twitter 提供给您的推文数量(参见6-9天包含)。您可以收集的推文数量取决于您的关键字和 Twitter 提供的内容。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接