Kepler在访问共享内存时,带宽是Fermi的两倍还是四倍?
编程指南中提到:
每个bank每两个时钟周期有32位的带宽
对于2.X版本,以及
每个bank每一个时钟周期有64位的带宽
对于3.X版本,因此暗示了带宽高达四倍?
Kepler在访问共享内存时,带宽是Fermi的两倍还是四倍?
编程指南中提到:
每个bank每两个时钟周期有32位的带宽
对于2.X版本,以及
每个bank每一个时钟周期有64位的带宽
对于3.X版本,因此暗示了带宽高达四倍?
根据编程指南4.2:
共享内存有16个银行,这些银行被组织成每32位相继的字映射到连续的银行。每个银行在两个时钟周期内具有32位的带宽。
Kepler白皮书:
与Fermi SM相比,64b及更大负载操作的共享内存带宽也翻倍,每个核心时钟为256B。
对于小负载操作,其带宽高4倍。