我的Pandas数据框有一百万行。我需要在每一行内调用一个rest API调用,并需要捕获响应。每次rest调用平均需要2秒钟的时间。但是我尝试过的以下情况非常慢。
情况1:应用
def predict(x):
res = request("XYZ")
return res.json()
df['response_value'] = df.apply(lambda x:predict(x['request_filed']),axis=1)
案例2: 向量化代替应用
def predict(x):
l = []
for each in x
l.append(request("XYZ"))
return l
df['response_value'] = predict(df['request_filed']
案例三:并行应用
def predict(x):
res = request("XYZ")
return res.json()
df['response_value'] = df.parallel_apply(lambda x:predict(x['request_filed']),axis=1)
有没有更好的方法来加快这个过程?