我使用present命令来提交MPI作业:mpirun -np 处理器数量 文件名
我的理解是上述命令可以让我向通过MPI通信的4个独立处理器提交作业。但是,在我们的设置中,每个处理器都有4个未被利用的内核。
我有以下问题:
是否可以从MPI运行命令行提交在同一节点上或多个节点上运行的多个内核的作业?如果可以,如何实现?
上述操作是否需要代码中的特殊注释/设置?我了解从阅读一些文献中得知,内核之间的通信时间可能与处理器之间的不同,因此需要考虑如何分配问题...但对于这个问题,还需要估计什么?
最后,数据传输量是否有限制?总线可以发送/接收多少数据?缓存是否有限制?
谢谢!