在我的内核中,我需要一个积累器数组。
__kernel myKernel(...)
{
float accum[SIZE] = {};
for(i=0; i<ITER; ++i) {
accum[...] += ...
}
...
}
在C语言中,= {}
会将数组初始化为0,但我不确定在OpenCL中是否也是这样?我需要像下面这样写,还是会造成计算资源浪费?
float accum[SIZE];
for(int i=0; i<SIZE; ++i) accum[i] = 0;