我以前在另一个问题中使用了与附件相同的图表。可以看到,峰值带宽超过5.5GB/s。我使用 NVIDIA 的带宽测试程序从代码示例中查找主机和设备之间及其反向方向的带宽。该系统由两个插槽上的总共12个Intel Westmere CPU和4个带有4个PCIe Gen2 Express插槽的Tesla C2050 GPU组成。现在的问题是,由于单向PCIe x16 Gen2的峰值带宽为4GB/s,因此在执行主机到设备传输时如何获得更多的带宽?我知道每个PCIe都通过I/O控制器集线器连接到CPU,后者通过QPI(更高的带宽)与CPU连接。