在OS X上使用mpirun

4

有没有一种方法可以在OS X Leopard(10.5.6)上本地运行超过62个进程的MPI作业? 当我使用62个进程运行作业时,它就会挂掉。

$mpirun -np 62 a.out 
mpirun noticed that job rank 0 with PID 0 on node Macintosh-001D4F4BC6BC.private exited on signal 15 (Terminated). 
60 additional processes aborted (not shown)

当我使用61个进程运行它时,它可以正常运行。


我注意到一个mpi hello world程序也有同样的问题。信号15似乎是通用的。我的猜测是mpi库由于操作系统限制而终止并没有发出好的错误提示。 - Dana the Sane
1个回答

3

针对我的评论,我做了一些谷歌搜索,怀疑这是由操作系统设置的资源限制引起的。此外,与失败相邻的多个2可能有问题。我最好的猜测是mpi库中的某些东西(也许是MPI_Send)正在生成超过266个限制的额外进程(请参见ulimit -a)。


看起来没问题。我设置了“ulimit -n 500”,问题解决了。 - Milhous
@Milhous,你是如何设置ulimit -n 500的?这是在安装还是运行mpirun时设置的? - kilojoules
当运行mpirun时,它会发生。 - Dana the Sane

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接