多进程:同时向两个列表追加元素

4

我有这段代码:

from multiprocessing import Pool, Manager
import numpy as np

l = Manager().list()

def f(args):
    a, b = args
    l.append((a, b))


data = [(1,2), (3,4), (5,6)]
with Pool() as p:
    p.map(f, data)
x, y = np.transpose(l)

# do something with x and y...

实际上,数据是由许多值组成的数组,转置操作需要花费大量时间和内存。

我希望能够直接将“a”和“b”追加到列表x和y中,以避免进行转置操作。重要的是输出保持与数据的对应关系,并且看起来像这样:[[1,3,5],[2,4,6]]

有什么聪明的方法可以做到这一点吗?

1个回答

6

不要尝试从子进程中追加内容,而是可以让函数返回值,并在主进程中追加它们;您无需关心子进程之间的相互访问(也无需使用管理器)。

from multiprocessing import Pool


def f(args):
    a, b = args
    # do something with a and b
    return a, b


if __name__ == '__main__':
    data = [(1,2), (3,4), (5,6)]
    x, y = [], []
    with Pool() as p:
        for a, b in p.map(f, data):   # or   imap()
            x.append(a)
            y.append(b)

    # do something with x and y
    assert x == [1,3,5]
    assert y == [2,4,6]

太棒了,我找到了一种使用值锁定获取相同结果的技巧,但是你的解决方案大约快100倍! - aroville

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接