我使用Python的'multiprocessing'模块在多个核心上运行单个进程,但我希望能够并行运行几个独立的进程。例如,第一个进程解析大文件,第二个进程在不同的文件中查找模式,第三个进程则进行一些计算;这三个具有不同参数集的不同进程是否可以并行运行?
def Process1(largefile):
Parse large file
runtime 2hrs
return parsed_file
def Process2(bigfile)
Find pattern in big file
runtime 2.5 hrs
return pattern
def Process3(integer)
Do astronomical calculation
Run time 2.25 hrs
return calculation_results
def FinalProcess(parsed,pattern,calc_results):
Do analysis
Runtime 10 min
return final_results
def main():
parsed = Process1(largefile)
pattern = Process2(bigfile)
calc_res = Process3(integer)
Final = FinalProcess(parsed,pattern,calc_res)
if __name__ == __main__:
main()
sys.exit()
在上面的伪代码Process1、Process2和Process3是单核进程,即它们不能在多个处理器上运行。这些进程按顺序运行,需要2+2.5+2.25小时=6.75小时。是否可能并行运行这三个进程?使它们在不同的处理器/核上同时运行,并且当最费时间的(Process2)完成后,再运行最终进程。
subprocess
模块吗? - Tim Peters