Hydra MPI的最佳进展是什么?

6
2个回答

9
从我的工作角度来看,最大的进步是可扩展性处理启动。使用以前的进程启动器在基于MPICH2的MPI实现中启动8000多个任务作业速度非常慢,并且经常因超时或其他网络问题而失败,这几乎排除了MPICH2-based MPIs 用于我们最大的作业。但是Hydra具有良好的分层启动模型,也可以利用您的资源管理器。
拓扑感知分配策略也很好,但与作业启动失败(或需要数小时)和作业成功之间的差异相比,它是二阶效应。

5
我完全同意Jonathan的看法,关于工作启动时间的大幅改进。此外,Hydra在几乎所有方面都比以前的进程管理器更加实用和强大。它的启动更加可靠,具有更多功能(进程核心绑定、基于格式的输出文件重定向、资源管理器和批处理调度程序集成等),并且比MPICH2的所有先前进程管理器都具有更少的神秘错误消息。
另一个关键因素是,Hydra正在积极维护,而几乎所有其他PM现在都已被弃用或不受支持。因此,如果您在Hydra中报告错误,它很可能会得到修复,而这对于MPD或remshell来说并非如此。
据我所知,您还可以使用Hydra启动非MPI作业,例如UPC程序,如果您知道该怎么做。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接