我该如何对数百万个地址进行地理编码(获取纬度和经度)?

3
我有一个包含数百万美国地址的数据集,想要进行地理编码。雅虎曾经有一个API,速率限制最高(每天50K次请求),但现已停用。除非我可以进行超过100K次请求,否则我不认为任何API都能满足我的需求。
是否有简单易用的软件可以从我的计算机上下载来完成这项任务?
特别是对于那些有经验的人,http://www.datasciencetoolkit.org/developerdocs#setup是否适合我的需求?

我会先测试他们网站上的代表性地址样本,然后与谷歌的结果进行比较。如果他们的数据看起来不错,那就开始吧! - flup
1个回答

0

您需要支持每天数百万请求的API吗?

很少有服务可以做到这一点。特别是SmartyStreets的LiveAddress可以处理这种负载,实际上就是为此而构建的。您可以上传文件(如Excel或CSV等,尤其是如果您有那么多文件,则应将它们压缩),也可以查询API(每个请求可以支持100个地址)。

因此,虽然该程序不会下载到您的计算机上,但在高负载时,它实际上比本地内部解决方案更快,因为它可以扩展。LiveAddress是地理分布式的,并由RAM驱动器服务器提供支持,当有大量工作要做时,它会启动更多节点。LiveAddress以快速处理数百万个地址而闻名(例如在几小时内)。

我在SmartyStreets工作。我们有点挑战你,看看你能以多快的速度合法地查询API或上传和处理所有列表。GitHub上有大量的示例代码可供使用,也可以(通过编程或手动方式)上传您的列表文件进行批量地理编码。


超出了我的预算范围,但谢谢。 - Elliot JJ

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接