9得票1回答
使用动态并行性(CUDA)编译.cu文件

我切换了一个支持动态并行的cc 5.2显卡GeForce GTX 980。但是,我无法编译一段简单的代码(来自编程指南)。这里不需要提供代码(只是全局内核调用另一个全局内核)。 1) 我使用VS2013进行编码。在属性页->CUDA C/C++->设备中,我将代码生成属性更改为compute...

7得票2回答
CUDA动态并行性,性能差

我们在使用CUDA动态并行性时遇到了性能问题。目前,CDP的性能至少比传统方法慢3倍。 我们编写了最简单的可重现代码来展示这个问题,即将数组中所有元素的值增加1。例如: a[0,0,0,0,0,0,0,.....,0] --> kernel +1 --> a[1,1,1,1,1...

7得票1回答
CUDA设备运行时API cudaMemsetAsync无法工作。

我正在尝试从内核(即所谓的“动态并行性”)调用cudaMemsetAsync。但是无论我使用什么值,它总是将内存设置为0。 这是我的测试代码: #include "cuda_runtime.h" #include "device_launch_parameters.h" #include ...