我想并行地对所有pandas列应用某些函数。例如,我想以并行方式执行以下操作:
我知道有一个
def my_sum(x, a):
return x + a
df = pd.DataFrame({'num_legs': [2, 4, 8, 0],
'num_wings': [2, 0, 0, 0]})
df.apply(lambda x: my_sum(x, 2), axis=0)
我知道有一个
swifter
包,但它不支持在apply中使用axis=0
。
NotImplementedError: Swifter无法在大型数据集上执行axis=0的apply操作。Dask当前没有实现axis=0的apply操作。更多细节请参考https://github.com/jmcarpenter2/swifter/issues/10
Dask也不支持在axis=0
时进行此操作(根据swifter文档)。
我已经搜索了几个来源,但没有找到简单的解决方案。
不能相信在pandas中会这么复杂。
Pandarallel
。 - ankyaxis=1
? - Quang Hoang