我对CUDA内核的工作原理有一个新手疑问。
如果我有以下代码(使用来自这里的cuPrintf
函数):
#include "cuPrintf.cu"
__global__ void testKernel(int param){
cuPrintf("Param value: %d\n", param);
}
int main(void){
// initialize cuPrintf
cudaPrintfInit();
int a = 456;
testKernel<<<4,1>>>(a);
// display the device's greeting
cudaPrintfDisplay();
// clean up after cuPrintf
cudaPrintfEnd();
}
执行的输出是:
Param value: 456
Param value: 456
Param value: 456
Param value: 456
我无法理解内核如何读取我传递的参数的正确值,它不是分配在主机内存中吗?GPU能够从主机内存中读取吗?
谢谢,
安德烈