关联标签
177得票2回答
CUDA块/线程束/线程如何映射到CUDA核心?

我已经使用CUDA几周了,但是对于块/线程/线程组的分配仍有一些疑问。 我从教学的角度研究这个架构(大学项目),所以达到最高性能不是我的关注点。 首先,我想了解一下我是否掌握了以下事实: 程序员编写一个内核,并将其执行组织为线程块网格。 每个块分配给一个流多处理器(SM)。一旦分配,它...

7得票1回答
为什么GPU的一个SM中有两个warp调度器?

我阅读了NVIDIA Fermi白皮书,并在计算SP core和调度器的数量时感到困惑。 根据白皮书,在每个SM中,有两个warp scheduler和两个指令分派单元,允许两个warp同时发出和执行。每个SM有32个SP core,每个core都有一个完全流水线化的ALU和FPU,用于执行...