547得票19回答
如何检查PyTorch是否使用GPU?

我该如何检查PyTorch是否正在使用GPU?nvidia-smi命令可以检测GPU活动,但我想直接从Python脚本内部进行检查。

531得票19回答
Nvidia NVML驱动程序/库版本不匹配

当我运行nvidia-smi时,我收到以下消息:Failed to initialize NVML: Driver/library version mismatch一个小时之前我收到了同样的消息并卸载了我的CUDA库,然后我能够运行nvidia-smi,得到以下结果:之后,我从官方NVIDIA...

290得票7回答
nvcc和NVIDIA-smi显示的CUDA版本不同。

我对运行which nvcc和nvidia-smi所显示的不同CUDA版本感到非常困惑。我在我的ubuntu 16.04上安装了cuda9.2和cuda10。现在我将路径设置为指向cuda9.2。所以当我运行时 $ which nvcc /usr/local/cuda-9.2/bin/nvc...

177得票2回答
177得票2回答
CUDA块/线程束/线程如何映射到CUDA核心?

我已经使用CUDA几周了,但是对于块/线程/线程组的分配仍有一些疑问。 我从教学的角度研究这个架构(大学项目),所以达到最高性能不是我的关注点。 首先,我想了解一下我是否掌握了以下事实: 程序员编写一个内核,并将其执行组织为线程块网格。 每个块分配给一个流多处理器(SM)。一旦分配,它...

155得票6回答
如何选择在哪个GPU上运行任务?

在多GPU计算机中,我该如何指定CUDA作业应在哪个GPU上运行?例如,在安装CUDA时,我选择安装了NVIDIA_CUDA-<#.#>_Samples,然后运行了几个nbody模拟实例,但它们都在GPU 0上运行; GPU 1完全空闲(使用watch -n 1 nvidia-dm...

139得票3回答
如何选择CUDA核心的网格和块维度?

这是一个关于如何确定CUDA网格,块和线程大小的问题。这是基于这里发布的一个额外问题。 通过上述链接,talonmies的答案包含了一段代码片段(见下文)。我不理解“该值通常由调优和硬件限制选择”的意思。 在CUDA文档中我没找到一个好的解释或澄清。总之,我的问题是如何确定给定以下代码的最...

129得票9回答
能否在AMD GPU上运行CUDA?

我想拓展我的技能,学习GPU计算。我对光线追踪和实时图形(OpenGL)很熟悉,但下一代图形和高性能计算似乎是基于GPU计算或类似的技术。 我目前在家里的电脑上使用的是AMD HD 7870显卡。我能为它编写CUDA代码吗?(我的直觉告诉我不行,但由于Nvidia发布了编译器二进制文件,我可...

118得票5回答
什么是银行冲突?(进行Cuda/OpenCL编程)

我一直在阅读CUDA和OpenCL的编程指南,但是我无法理解什么是银行冲突。他们只是简单地介绍了如何解决这个问题,没有详细解释这个主题本身。有人可以帮我理解吗?我对于帮助是在CUDA/OpenCL的上下文中还是在计算机科学中的银行冲突方面都没有偏好。

108得票10回答
NVIDIA与AMD:GPGPU性能比较

我希望听到有编写经验的人关于两种技术的看法。就我个人而言,我只有使用NVIDIA的经验。 NVIDIA CUDA似乎比竞争对手更受欢迎。(仅在本论坛上计算问题标签,“cuda”比“opencl”多三倍,“nvidia”比“ati”多15倍,而“ati-stream”的标签根本不存在)。 另...