7得票1回答
CUDA - 确定共享内存中的银行数

共享内存被“分成”了许多个bank。这就导致了整个bank冲突的问题,我们都知道。 问题: 但是你如何确定共享内存中有多少个bank(“条纹”)? (在NVIDIA“devtalk”论坛上搜索,似乎每个块的共享内存被“分成”了16个bank。但是我们怎么知道呢?建议这样做的线程已经有几年了...

15得票3回答
内核构造和并行构造的区别

我学习了很多OpenACC的文章和手册,但仍然不理解这两个结构之间的主要区别。

8得票1回答
使用CMake编译带有CUDA代码的C++

我正在尝试将CUDA函数添加到使用CMake的现有C++项目中。 例如,main.cpp看起来像这样: #include <stdio.h> #include "kernels/test.cuh" int main() { wrap_test_print(); ret...

7得票1回答
OpenCV 2.4.3rc 和 CUDA 4.2: "OpenCV错误:无GPU支持"

我已经将几张截图上传到这个相册中:http://imgur.com/a/w4jHc 我正在尝试在Visual Studio 2008中使用OpenCV运行GPU。我正在运行OpenCV GPU示例代码之一,bgfg_segm.cpp。但是,当我编译(没有编译错误)时,它会抛出“OpenCV错...

15得票1回答
CUDA中的动态共享内存

有类似于我将要询问的问题,但我觉得它们都没有涉及到我真正寻找的核心。我现在拥有一个需要将两个数组定义到共享内存中的CUDA方法。现在,数组的大小由一个在程序执行开始后读入程序的变量给出。因此,我不能使用该变量来定义数组的大小,因为定义共享数组的大小需要在编译时知道值。我不想像这样做 __sha...

13得票4回答
错误:标识符“blockIdx”未定义。

我的CUDA配置: Visual Studio 2010和2008 SP1(CUDA所需)。 Parallel NSight 1.51 CUDA 4.0 RC或3.2和Thrust 基本上,我按照以下指南进行: http://www.ademiller.com/blogs/tech/20...

26得票5回答
在OSX上出现"NVIDIA Cuda错误",错误信息为"所有CUDA兼容设备都忙或不可用"。

我经常会遇到CUDA库完全失败并返回错误46(“所有支持CUDA的设备都忙或不可用”),甚至对于像cudaMalloc这样的简单调用。如果我重新启动计算机,代码就可以成功运行,但这远非理想。这个问题显然是相当普遍的。 我的设置如下: OSX 10.6.8 NVIDIA CUDA驱动程序:...

14得票2回答
使用CUDA 5时 cudaMemcpyToSymbol 出现错误

问题 我准备了一个使用常量内存的CUDA代码样例。我可以在CUDA 4.2中成功运行它,但是当我使用CUDA 5编译时,我会得到"invalid device symbol"的错误。我在这里附上了示例代码。 代码#include <iostream> #include <...

13得票4回答
如何使用CUDA在GPU上运行MATLAB代码?

我想使用NVIDIA的CUDA在GPU上运行MATLAB代码。我找到了一些第三方引擎: Jacket GPUMat 有人推荐这些吗?或者还有更好的选择吗?有什么提示或建议吗?

8得票1回答
CUDA和C的Makefile

我正在处理一个使用.c和.cu文件的项目。原始软件包完全是用C编写的,并且有自己的Makefile(运行良好)。我将.cu文件添加到了该项目中,现在我想修改Makefile以便一起编译所有文件。 以下是我的尝试: CC = nvcc SOURCEDIR = ../sourcedir E...