我有一个numpy数组,希望以一种不涉及复制的方式在一些Python进程之间共享。使用sharedmem包,我可以从现有的numpy数组创建一个共享的numpy数组。
import sharedmem as shm
def convert_to_shared_array(A):
shared_array = shm.shared_empty(A.shape, A.dtype, order="C")
shared_array[...] = A
return shared_array
我的问题是每个子进程需要访问在数组中随机分布的行。目前,我使用sharedmem包创建一个共享的numpy数组,并将其传递给每个子进程。每个进程还有一个列表idx,其中包含它需要访问的行。问题出现在子进程中,当我执行以下操作时:
#idx = list of randomly distributed integers
local_array = shared_array[idx,:]
# Do stuff with local array
它创建了数组的一个副本,而不仅仅是另一个视图。该数组非常大,需要在共享之前先对其进行操作,以便每个进程访问一系列连续的行,例如:
local_array = shared_array[start:stop,:]
花费太长时间。
问题:有没有好的解决方案可以在 python 进程之间共享 numpy 数组的随机访问,而不涉及复制数组?
子进程需要只读访问(因此无需对访问进行锁定)。