如何在运行时定义大小已知的CUDA共享内存？

Question

8

在CUDA中，__shared__内存似乎需要在编译时知道其大小。然而，在我的问题中，__shared__内存的大小只有在运行时才能确定，即：

int size=get_size();
__shared__ mem[size];

这将导致 "错误：常量值未知"，我不确定如何解决这个问题。

- Hailiang Zhang

可能是分配共享内存的重复问题。 - talonmies

2个回答

1

你应该使用extern__shared__ mem[];（动态共享内存）而不是__shared__ mem[size];（静态共享内存）。参见[https://devblogs.nvidia.com/parallelforall/using-shared-memory-cuda-cc/][1]]。

- Hosein Hasani

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Roger Dahl · Accepted Answer

共享内存的目的是允许块中的线程协作。当您将一个数组声明为__shared__时，块中的每个线程看到的是相同的内存，因此对于给定的线程来说，为共享内存中的数组设置自己的大小是没有意义的。

然而，支持动态指定单个__shared__数组的大小，该大小对于所有线程都相同。请参见分配共享内存。

如果确实需要为每个线程动态分配内存，则可以在内核中使用new或malloc（在Fermi上），但它们分配的是全局内存，可能会很慢。