我正在使用纽约市出租车数据集。该数据集包括日期时间、上车纬度/经度、下车纬度/经度等列。现在我想反向地理编码以找到区域/社区。我发现geopy
可以完美地处理这样的问题:
from geopy.geocoders import Nominatim
geolocator = Nominatim()
borough = []
loc = ['40.764141, -73.954430', '40.78993085, -73.9496098723']
for l in loc:
sub = str(geolocator.reverse(l))
borough.append(sub.split(', ')[2])
borough
## ['Upper East Side', 'East Harlem']
这个方法很完美,正是我需要的。但是我的数据集有数百万行,并且由于这是一个在线API,所以不太可行。有没有更好的方法来完成这个任务?