我有一个CUDA头文件(.cuh),其中包含两个常量浮点数组。有两个文件包括此头文件,一个是尝试复制到此常量内存的CPP文件,另一个是尝试使用此常量内存的CUDA文件。所有三个文件都在应该编译成DLL的项目中。
我尝试用以下代码简化事情:
obj1.cuh
#pragma once
__constant__ float d_array1[5];
__constant__ float d_array2[5];
obj1.cu
#include "obj1.cuh"
//do random stuff
__global__ void kernel(float * d_array1, float * d_array2) {
int id = threadIdx.x;
float sum = d_array1[i] + d_array2[i];
}
ext.cpp
#include "obj1.cuh"
void function(float * array1, float * array2) {
cudaMemcpyToSymbol(d_array1, array1, sizeof(float)*5);
cudaMemcpyToSymbol(d_array2, array2, sizeof(float)*5);
kernel<<<1,5>>>(d_array1,d_array2);
}
构建失败并输出以下错误信息:
1>ext.obj : error LNK2005: "float * d_array1" (?d_array1@@3PAMA) already defined in obj1.cu.obj
1>ext.obj : error LNK2005: "float * d_array2" (?d_array2@@3PAMA) already defined in obj1.cu.obj
在您询问之前,是的,我已经尝试使用包含保护而不是#pragma once,但仍然输出相同的错误。
obj1.cuh的包含保护版本
#ifndef CONSTANTARRAYS
#define CONSTANTARRAYS
__constant__ float d_array1[5];
__constant__ float d_array2[5];
#endif