Python多进程：如何在池中添加或更改进程数量

Question

Python多进程：如何在池中添加或更改进程数量

5

我已经从Python的multiprocessing模块创建了一个进程池，并且想要更改进程池中运行进程的数量或者添加进程。这是可能的吗？我已经尝试过类似以下简化版代码的方式：

class foo:
    def __init__():
        self.pool = Pool()
    def bar(self, x):
        self.pool.processes = x
        return self.pool.map(somefunction, list_of_args)

看起来这个方法可以实现我想要的目的，即在多个进程之间分配工作，但我不确定这是否是最好的方法，或者为什么能够实现。

- sdiemert

2个回答

1

您可以使用私有变量_processes和私有方法_repopulate_pool。但是我不建议使用私有变量等。

pool = multiprocessing.Pool(processes=1, initializer=start_process)
>Starting ForkPoolWorker-35

pool._processes = 3
pool._repopulate_pool()
>Starting ForkPoolWorker-36
>Starting ForkPoolWorker-37

- Christian Will

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Noah · Accepted Answer

我不认为这实际上有效：

import multiprocessing, time

def fn(x):
    print "running for", x
    time.sleep(5)

if __name__ == "__main__":
    pool = multiprocessing.Pool()
    pool.processes = 2

    # runs with number of cores available (8 on my machine)
    pool.map(fn, range(10))

    # still runs with number of cores available, not 10
    pool.processes = 10
    pool.map(fn, range(10))

multiprocessing.Pool 存储进程数在一个私有变量中 (即 Pool._processes)，该变量在实例化 Pool 时设置。请查看源代码。

这似乎是工作正常的原因是，除非您指定不同的数量，否则进程数会自动设置为当前计算机上的核心数。

我不确定为什么您想要更改可用进程的数量--也许您可以详细解释一下。不过，每当您需要时（可能是在其他池运行完成后），创建新池非常容易。