我将使用Cudafy在NVIDIA GPU上进行一些计算。(Quadro K1100M能力为3.0,如果有关系的话)
我的问题是,当我使用以下内容时:
此外,如果我需要做类似以下的事情:
我的问题是,当我使用以下内容时:
cudaGpu.Launch(new dim3(44,8,num), new dim(8, 8)).MyKernel...
当我在内核中使用GThread实例时,为什么我的z索引总是为零?
int z = thread.blockIdx.z * thread.blockDim.z + thread.threadIdx.z;
此外,如果我需要做类似以下的事情:
cudaGpu.Launch(new dim3(44,8,num), new dim(8, 8, num)).MyKernel...
z会给出应有的不同索引,但由于每个块中线程数量的限制,num不能太大。有什么建议可以解决这个问题吗?
编辑
另一种表述方式是:当块大小只有2D时,我能在我的内核中使用thread.z吗(用于任何有用的东西)?