我可以找到CPU核心和其缓存、主存等之间的延迟,以ns或CPU周期为单位。
但是似乎很难找到关于现代GPU类似的信息。
有人知道GPU的延迟吗?特别是现代nvidia GPU(GF110或更高版本)与它们的内存之间的延迟,谢谢。
GPU内存确实具有更大的带宽,但它们的延迟如何呢?
我听说GPU的延迟与CPU的延迟一样高,因此对于许多通用计算任务来说,更大的带宽基本上是毫无意义的,我只需要确认这一点。
我可以找到CPU核心和其缓存、主存等之间的延迟,以ns或CPU周期为单位。
但是似乎很难找到关于现代GPU类似的信息。
有人知道GPU的延迟吗?特别是现代nvidia GPU(GF110或更高版本)与它们的内存之间的延迟,谢谢。
GPU内存确实具有更大的带宽,但它们的延迟如何呢?
我听说GPU的延迟与CPU的延迟一样高,因此对于许多通用计算任务来说,更大的带宽基本上是毫无意义的,我只需要确认这一点。
由于厂商不会公开所有架构细节,因此研究人员使用反向工程来揭示GPU架构的神秘面纱。请参阅本论文Demystifying GPU microarchitecture through microbenchmarking和引用了该论文的其他文章(请注意,这不是我的论文)。我已经将他们的发现复制在下面的图片中。