占用率被定义为一个流多处理器上活动线程束数与最大支持线程束数之比。假设我在一个流多处理器上运行了4个块,每个块有320个线程,即10个线程束,因此一个流多处理器上有40个线程束。假设一个流多处理器上最大支持的线程束数为48(CC 2.x),则占用率为40/48。
但是总共有320 * 4个线程在一个流多处理器上运行,而一个流多处理器只有48个CUDA核心。为什么占用率不是100%?我正在使用所有CUDA核心...
我很确定我漏掉了什么...
占用率被定义为一个流多处理器上活动线程束数与最大支持线程束数之比。假设我在一个流多处理器上运行了4个块,每个块有320个线程,即10个线程束,因此一个流多处理器上有40个线程束。假设一个流多处理器上最大支持的线程束数为48(CC 2.x),则占用率为40/48。
但是总共有320 * 4个线程在一个流多处理器上运行,而一个流多处理器只有48个CUDA核心。为什么占用率不是100%?我正在使用所有CUDA核心...
我很确定我漏掉了什么...