44得票1回答
IPoIB和Infiniband上的TCP之间的区别

有人可以解释一下IPoIB和TCP over Infiniband的概念吗?我了解原生Infiniband提供的总体概念和数据传输速率,但不太明白TCP和IPoIB的作用。为什么需要它们,它们是做什么的?当有人说他们的网络使用IPoIB或TCP时有什么区别?哪一个更好?我不是来自强大的网络背景...

34得票2回答
拥有支持InfiniBand的Windows Azure A8节点,如何在其中一个节点发送N字节并在另一个节点上接收?

我喜欢InfiniBand承诺的40Gbit/s网络。我的需求不适用于具有一个核心节点+从节点的MPI模型,如果可能的话,我宁愿根本不使用MPI。我需要简单的connect/send/receive/close(或其异步版本)API。然而,阅读MS Azure文档或Microsoft HPC ...

19得票3回答
InfiniBand解释

请有人解释一下什么是InfiniBand? 它与以太网相比的主要区别是什么,这些区别如何使其比以太网更快? 在mellanox的官方介绍中写道: 介绍InfiniBand,一种基于交换机的串行I/O互连架构,运行方式为... 什么意思是InfiniBand是一种基于交换机的互连技...

11得票3回答
"本地" RDMA 用于开发

我正在尝试构建和运行这里的RDMA示例。但因为我只是在探索,没有任何硬件能够管理RDMA。当我尝试运行示例代码时,会出现如下错误。 librdmacm: couldn't read ABI version. librdmacm: assuming: 4 CMA: unable to get ...

11得票1回答
RDMA内存共享

我有几台多核计算机通过Infiniband网络连接。 我想在共享内存池上进行一些低延迟计算,并具有远程原子操作。 我知道RDMA是可行的方法。在每个节点上,我将为数据共享注册内存区域(和保护域)。 在线RDMA示例通常关注单线程服务器和单线程客户端之间的单个连接。 现在,我想在每个Infin...

10得票1回答
InfiniBand:传输速率取决于MPI_Test*频率

我正在编写一个多线程的OpenMPI应用程序,使用来自几个线程的MPI_Isend和MPI_Irecv在InfiniBand RDMA上的排名之间每秒交换数百条消息。 传输大小为400-800K字节,为每个排名生成约9 Gbps的流出和流入数据,远远低于FDR的容量。简单的MPI基准测试也显...

10得票1回答
我该如何在Dask中使用InfiniBand网络?

我有一个高性能网络的集群 (InfiniBand)。 然而,当我设置我的Dask调度程序和工作节点时,性能似乎并不如我所期望的快。 我怎么告诉Dask使用这个网络呢? 免责声明:我只是问这个问题,以便回答它。这已经成为一个常见的问题。

10得票2回答
从GPU到远程主机的GPUDirect RDMA传输

场景: 我有两台机器,一台客户端和一台服务器,通过Infiniband连接。服务器机器有一块NVIDIA Fermi GPU,但客户端没有GPU。我在GPU机器上运行一个应用程序,用GPU进行一些计算。GPU上的结果数据从未被服务器机器使用,而是直接发送到客户端机器,没有任何处理。现在,我正...

10得票6回答
RDMA中的数据包捕获?

在Linux中,是否有像tcpdump一样的实用程序,可以捕获通过RDMA通道传输的流量?(Infiniband/RoCE/iWARP)

7得票2回答
MPI_SEND占用大量虚拟内存

在大量核心上调试我的程序时,我遇到了一个非常奇怪的错误,即“虚拟内存不足”。我的调查引导我找到了一段代码,在这里主节点向每个从节点发送小消息。然后我编写了一个小程序,其中一个主节点使用 MPI_SEND 发送 10 个整数,所有从节点都使用 MPI_RECV 接收。比较 /proc/self/...