CUDA线程层次结构只是一种方便的抽象,并不要求使用一个、两个或三个维度,如果您只使用一个维度而不是所有三个维度,也不会损失性能。只要指定了正确的网格尺寸,您就可以使用启动的所有线程以及一组索引。为了方便起见,threadIdx是一个3分量向量,因此可以使用一维、二维或三维线程索引来标识线程,形成一维、二维或三维线程块。这提供了一种自然的方式来在域中的元素(如向量、矩阵或体积)之间调用计算。更多信息请参阅:http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#thread-hierarchy