78得票5回答
如何完全从Ubuntu中删除CUDA?

我有一个Ubuntu 18.04系统,并且不小心安装了cuda 9.1来运行Tensorflow-gpu,但是似乎Tensorflow-gpu需要cuda 10.0,所以我想通过执行以下命令来先删除cuda: martin@nlp-server:~$ sudo apt-get remove ...

75得票2回答
GPU编程,CUDA还是OpenCL?

我是一个GPU编程新手,我有一台带有NVIDIA GeForce GT 640显卡的笔记本电脑。我面临两个问题,欢迎提供建议。 如果选择CUDA--Ubuntu还是Windows 显然,CUDA更适合Windows,而在Ubuntu上安装CUDA可能会成为一个严重的问题。我看到过一些博客文...

70得票5回答
CUDA确定每个块的线程数和网格中的块数

我对CUDA编程范式还不够熟悉。我的问题在于如何确定每个块中的线程数和网格中的块数。这里是否需要一些技巧和试错?我发现很多示例中似乎都是为这些参数选择了任意的数字。 我正在考虑一个问题,即我想要将矩阵(任意大小)传递给一个乘法方法。因此,C中的每个元素(如C = A * B)都将由单个线程计...

69得票6回答
错误信息:无法找到或打开PDB文件

我尝试运行官方网站NVIDIA提供的示例程序,大多数程序都很顺利,只有几个出现了类似的错误信息。我该如何修复呢?这是我在运行名为“MatrixMul”的程序后得到的一个错误信息示例。 注意:我已经在我的Window7x64操作系统上安装了x32和x64NVIDIA CUDA Toolkit ...

66得票1回答
如何使用pitched pointer与cuda API?何时应该使用?

我对使用cudaMalloc()和cudaMemcpy()分配和复制线性内存有很好的理解。然而,当我想使用CUDA函数来分配和复制2D或3D矩阵时,常常会被各种参数搞糊涂,特别是在处理2D/3D数组时经常出现pitched指针。文档提供了一些使用它们的示例,但假定我熟悉填充和pitch的概念,...

66得票5回答
我的电脑上安装了Ubuntu 14.04,CUDA被安装在哪里?

我正在尝试在我的Ubuntu 14.04上安装CUDA 7.5。我按照这个指南(通过软件包安装)的所有步骤进行: http://developer.download.nvidia.com/compute/cuda/7.5/Prod/docs/sidebar/CUDA_Installation_...

65得票5回答
__syncthreads()函数是否同步网格中的所有线程?

__syncthreads()函数是否同步网格中的所有线程,还是只同步当前warp或块中的线程? 此外,当特定块中的线程在内核中遇到以下行时: __shared__ float srdMem[128]; 他们只会在每个块中声明这个空间一次吗? 显然,它们都是异步操作的,因此如果块2...

63得票5回答
CUDA和张量核之间有什么区别?

我完全不了解与HPC计算相关的术语,但我刚刚看到EC2在AWS上发布了一种由新的Nvidia Tesla V100提供动力的实例类型,它具有两种“核心”:Cuda核心(5,120)和Tensor核心(640)。 两者有什么区别?

62得票7回答
从命令提示符编译CUDA时出现错误

我正在尝试通过命令提示符在Windows 7上编译一个CUDA测试程序,我使用的命令是:nvcc test.cu 但是我得到的只是这个错误:nvcc fatal : Cannot find compiler 'cl.exe' in PATH 这个错误可能是由什么引起的?

62得票4回答
CUDA中的gridDim和blockDim

我理解 blockDim 的含义,但是对于 gridDim 我存在疑问。 blockDim 给出了块的大小,但是 gridDim 是什么呢?在网上看到说 gridDim.x 给出了 x 轴方向上块的数量。 我要如何知道 blockDim.x * gridDim.x 的值是多少呢? 我如何知...