30得票2回答
CUDA是什么?它的作用是什么?有哪些好处?如何入门?

我对开发一些新技术很感兴趣,想尝试一下 CUDA。但是它们的文档过于技术化,没有提供我所需要的答案。此外,我也想从已经有 CUDA 经验的人那里听到这些答案。 基本上,我的问题如下: CUDA 究竟是什么?(是框架还是 API?) 它有什么用途?(除了将程序编写到 GPU ...

7得票2回答
OpenCl寄存器的神奇数字

我编写了两个不同的 OpenCl 内核,使用 NVIDIA 分析工具获取了一些信息,并发现两者都使用了每个工作项 63 个寄存器。 我尝试了我所能想到的一切来降低这个数字(用 ushort 替换 int,在 {} 中声明变量以告诉编译器何时可以摆脱它们),但似乎不可能改变这个 63! 然后...

106得票2回答
nvidia-smi 显存瞬时利用率说明?

我知道nvidia-smi -l 1每秒会给出GPU使用情况(类似于以下内容)。但是,我需要解释一下Volatile GPU-Util的真正含义。这是指已使用的SM数与总SM数之比,还是占用率,或者是其他什么?+-----------------------------------------...

10得票2回答
使用垂直同步(OpenGL)时,CPU利用率达到100%

这是一个非常简单的测试程序。当禁用垂直同步时,此程序以100FPS运行,并几乎不使用CPU。当我启用垂直同步时,我获得60FPS和25%(4核系统上1个核心的100%)的CPU利用率。这是使用Nvidia GPU。在网上搜索后,有人建议在Nvidia控制面板内禁用“多线程优化”。这确实降低了C...

8得票1回答
如何查看由GNU make运行的命令?

我正在尝试调试一个复杂的 Makefile。如何让 GNU make 打印它运行的所有命令?我在 man 页面中找不到答案(使用 -d 标志似乎没有打印出来)。 (这不是回答我的问题所必需的信息,但以防你想知道:我正在尝试编译基于 NVIDIA 的 CUDA 库构建的项目。我可以自己编译它,...

12得票2回答
在CUDA中获取浮点特殊值的方法是什么?

CUDA 中是否有获取 IEEE 754 特殊值(例如:inf,NaN)的设备函数?我的意思是稳定的方式,不是通过某些可能被编译器优化掉的数学操作。 我只找到了一个称为 nan() 的设备函数,它必须带一些未知的字符串参数。

7得票2回答
CUDA中有多少个网格?

一个GPU中可能有多少个CUDA网格? 一个GPU设备上是否可以存在两个网格?或者说,一个GPU设备只能有一个网格吗? Kernel1<<gridDim, blockDim>>(dst1, param1); Kernel1<<gridDim, block...

9得票1回答
clinfo显示“平台数量为0”

我是一名有用的助手,可以为您翻译文本。 我正在Centos 7.6 64位和Nvidia显卡上开发。我已经安装了Nvidia驱动程序和cuda驱动程序。 但是,当我运行“clinfo”时,它显示: Number of platforms ...

9得票4回答
测量GPU利用率的nvidia-smi替代方案是什么?

在使用某些工具和/或开发库/工具时,nVidia停止支持所有非Quadro和Tesla卡。我有两张GTX 590,当我使用nvidia-smi时,大多数可查询字段返回N / A,因为他们放弃了对这张卡的支持。 是否有其他工具声称可以收集此信息?使用SDK查询此信息是否可能/简单?

26得票1回答
Linux上使用专有的Nvidia驱动程序时,多个OpenGLX渲染上下文会失败。

当我尝试在单独的线程上运行超过128个当前的OpenGLX渲染上下文时,调用glXMakeCurrent开始失败。 Display *display = XOpenDisplay(":0") Window root_win = RootWindow(display, screen); Win...