GPU的延迟是什么?

5

我可以找到CPU核心和其缓存、主存等之间的延迟,以ns或CPU周期为单位。

但是似乎很难找到关于现代GPU类似的信息。

有人知道GPU的延迟吗?特别是现代nvidia GPU(GF110或更高版本)与它们的内存之间的延迟,谢谢。

GPU内存确实具有更大的带宽,但它们的延迟如何呢?

我听说GPU的延迟与CPU的延迟一样高,因此对于许多通用计算任务来说,更大的带宽基本上是毫无意义的,我只需要确认这一点。


1
这个研讨会http://www.stanford.edu/dept/ICME/docs/seminars/Rennich-2011-04-25.pdf或nvidia pdfs http://theinf2.informatik.uni-jena.de/theinf2_multimedia/Website_downloads/NVIDIA_Fermi_Perf_Jena_2011.pdf表明全局内存延迟为400-800个周期。共享内存没有确切的延迟时间,只有“几个周期”。算术延迟为18-22个周期(典型值)。一些测量结果在这里:https://dev59.com/wlnUa4cB1Zd3GeqPZ2BK#8881504 - osgx
1个回答

3

由于厂商不会公开所有架构细节,因此研究人员使用反向工程来揭示GPU架构的神秘面纱。请参阅本论文Demystifying GPU microarchitecture through microbenchmarking和引用了该论文的其他文章(请注意,这不是我的论文)。我已经将他们的发现复制在下面的图片中。Table V from a paper


成功编译了基准测试,并在Tesla K20上运行。据我所见,数字相当相似,只是共享内存延迟现在为48个周期。 - the swine

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接