提供信息,以下是我从Nvidia得到的规格
http://www.geforce.com/hardware/desktop-gpus/geforce-gtx-680/specifications
http://www.geforce.com/hardware/desktop-gpus/geforce-gtx-titan/specifications
请注意,他们网站上的内存速度/内存时钟是相同的,并且两者都以Gbps为单位进行测量。谢谢!
提供信息,以下是我从Nvidia得到的规格
http://www.geforce.com/hardware/desktop-gpus/geforce-gtx-680/specifications
http://www.geforce.com/hardware/desktop-gpus/geforce-gtx-titan/specifications
请注意,他们网站上的内存速度/内存时钟是相同的,并且两者都以Gbps为单位进行测量。GTX-680: 3 Gbps * 2 * 256 / 8 = 192 GB/s
GTX-Titan: 3 Gbps * 2 * 384 / 8 = 288 GB/s
因素D:延迟-或者现实打入你的脸
这个因素比以上所有因素加起来都要难计算得多。基本上,当您告诉RAM“嘿,我想要这些数据”时,它需要一段时间才能提供答案。这种延迟取决于许多因素,非常难以计算,并且通常导致RAM系统提供的速度远低于其理论最大值。这就是所有定时、预取和其他大量技术的实际应用场景。由于这不仅仅是可以用于营销的数字,其中更高的数字可以转化为“更好”的营销手段,所以营销重点主要放在其他方面。如果您好奇的话,这基本上就是GDDR5与主板上使用的DDR3不同的地方。
(内存时钟频率(以赫兹为单位)
× 总线宽度
÷ 8) × 内存时钟类型乘数
= 带宽(以 MB/s 为单位)
其中,内存时钟类型乘数
可以是以下之一:
HBM1 / HBM2:2
GDDR3:2
GDDR5:4
GDDR5X:8
让我们以撰写本文时的当前顶级显卡之一 GTX 1080 Ti 为例,该显卡使用 GDDR5X 内存。根据 techPowerUp! 的规格说明,该显卡的规格如下:
内存时钟:1376MHz
总线宽度:352位
内存类型:GDDR5X
如果我们将这些值代入上述公式,我们得到:
(1376 * 352 / 8) * 8 = 484 352 MB/s = ~484 GB/s
同样地,对于使用较旧的GDDR5内存的GTX 1070:
内存时钟:2002MHz
总线宽度:256位
内存类型:GDDR5
(2002 * 256 / 8) * 4 = 256 256 MB/s = ~256 GB/s
最后,对于使用HBM1的AMD Fury X:
内存时钟:500MHz
总线宽度:4096位
内存类型:HBM1
(500 * 4096 / 8) * 2 = 512 000 MB/s = 512 GB/s
还有使用HBM2的Vega 64:
内存时钟:945MHz
总线宽度:2048位
内存类型:HBM2
(945 * 2048 / 8) * 2 = 483 840 MB/s = ~484 GB/s
我认为正确的计算方法在这里已经解释清楚了:
https://www.goldfries.com/computing/gddr3-vs-gddr5-graphic-card-comparison-see-the-difference-with-the-amd-radeon-hd-7750/
简而言之:
"(存储器时钟 x 总线宽度 / 8) * GDDR 类型乘数 = 带宽(GB/s)
GDDR 类型乘数为 GDDR3 为2,GDDR5 为4。"
还有更多详细的信息,在那里都有很好地解释和详细说明。