我有几个与图像处理相关的应用程序文件。在进行一些图像处理算法时,图像的行数和列数不会发生变化,因此我尝试将这些值存储在常量内存中。我的应用程序如下:
Imageproc.cuh
...
...
__constant__ int c_rows;
__constant__ int c_cols;
#ifdef __cplusplus
extern "C"
{
#endif
...
...
#ifdef __cplusplus
}
#endif
Imageproc.cu
...
...
int algorithm(float *a, const int rows, const int cols){
...
...
checkCudaError(cudaMemcpyToSymbol(&c_rows, &rows, sizeof(int)));
checkCudaError(cudaMemcpyToSymbol(&c_cols, &cols, sizeof(int)));
dim3 block(T, T);
dim3 grid(cols/T+1, rows/T+1);
kernel<<<grid, block>>>( ... );
...
...
}
代码编译通过,但运行程序时出现错误: invalid device symbol cudaMemcpyToSymbol(&c_rows, &rows, sizeof(int))
我不能将这些变量放入常量内存中吗?或者我错过了什么?
cudaMemcpyToSymbol
需要一个字符串作为目标符号名称? - Paul R