如何使用外部的CUDA设备变量

Question

如何使用外部的CUDA设备变量

3

我需要将代码写入多个 .cu 文件。但是在哪里定义设备变量，它们用于许多 .cu 文件。

例如

文件 common.h

__device__ int x;

File A.cu

__global__ void a()

文件 B.cu

__global__ void b()

a()和b()都使用了x。我该怎么办？

在C语言中，我应该这样写：

extern <strong>device</strong> int x;

然后我在另一个地方定义device int x。但是在CUDA中，我不能这样做。如果我这样做，它会告诉我“..........”之前已经声明过。

- worldterminator

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Robert Crovella · Accepted Answer

编辑：@talonmies是正确的（像往常一样）。因此，我删除了关于CUDA 4.1的评论。

此外，我给出的编译命令不太正确。所以让我用一个明显有效且具有适当说明的答案来替换我的答案。

您需要CUDA 5.0和计算能力2.0或更高的设备才能使用此功能。

我相信可能有更好的方法，但这对我来说似乎有效：

com.h：

#ifndef DEVMAIN
extern __device__ int x;
#endif

a.cu:

#include "com.h"
__global__ void a(){

  x = -5;
}

b.cu:

#include <stdio.h>
#define DEVMAIN
#include "com.h"

extern __global__ void a();
__device__ int x;

__global__ void b(){

  x = 5;
}

int main() {
  int temp=7;
  cudaMemcpyToSymbol(x,&temp, sizeof(int));
  a<<<1,1>>>();
  cudaMemcpyFromSymbol(&temp,x,sizeof(int));
  printf("in host : %d\n",temp);
  b<<<1,1>>>();
  cudaMemcpyFromSymbol(&temp,x,sizeof(int));
  printf("in host2 : %d\n",temp);
  return 0;
}

编译中：

nvcc -arch=sm_20 -dc a.cu
nvcc -arch=sm_20 -dc b.cu
nvcc -arch=sm_20 -o ab a.o b.o

输出：

$ ./ab
in host : -5
in host2 : 5
$

很抱歉之前我的错误。