CUDA:主机到设备带宽高于PCIe峰值带宽?

4
我以前在另一个问题中使用了与附件相同的图表。可以看到,峰值带宽超过5.5GB/s。我使用 NVIDIA 的带宽测试程序从代码示例中查找主机和设备之间及其反向方向的带宽。该系统由两个插槽上的总共12个Intel Westmere CPU和4个带有4个PCIe Gen2 Express插槽的Tesla C2050 GPU组成。现在的问题是,由于单向PCIe x16 Gen2的峰值带宽为4GB/s,因此在执行主机到设备传输时如何获得更多的带宽?我知道每个PCIe都通过I/O控制器集线器连接到CPU,后者通过QPI(更高的带宽)与CPU连接。
1个回答

6

PCIe x16 Gen2 的峰值带宽在每个方向上为8GB/s。您没有超过峰值。


谢谢,我找到了这个关于PCI-E的有用链接 - http://kb.pert.geant.net/PERTKB/HostBus - Sayan

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接