531得票19回答
Nvidia NVML驱动程序/库版本不匹配

当我运行nvidia-smi时,我收到以下消息:Failed to initialize NVML: Driver/library version mismatch一个小时之前我收到了同样的消息并卸载了我的CUDA库,然后我能够运行nvidia-smi,得到以下结果:之后,我从官方NVIDIA...

26得票1回答
Linux上使用专有的Nvidia驱动程序时,多个OpenGLX渲染上下文会失败。

当我尝试在单独的线程上运行超过128个当前的OpenGLX渲染上下文时,调用glXMakeCurrent开始失败。 Display *display = XOpenDisplay(":0") Window root_win = RootWindow(display, screen); Win...

8得票1回答
如何使用CUDA C进行矩阵加法

我正在编写一个简单的代码,用于将两个矩阵A和B的元素相加;这段代码非常简单,灵感来自于CUDA C编程指南第2章中给出的示例。 #include <stdio.h> #include <stdlib.h> #define N 2 __global__ void M...

9得票3回答
在Nvidia和AMD硬件上使用OpenCL FFT?

我正在开发一个项目,需要在 Nvidia 和 AMD 的图形卡上使用 FFT。一开始我找了一个可以在两者上运行的库(考虑使用 OpenCL),但是没有找到合适的。 有人建议我需要使用每个供应商的 FFT 实现,并编写一个包装器根据平台选择使用哪个实现。我很容易找到 AMD 的实现,但是我现在...

24得票2回答
如何检查nvidia-docker版本?

我尝试过 nvidia-docker --version 命令,但它只显示了 docker 的版本号。 经过查阅官方文档,我没有找到任何关于此命令的信息。 如何检查 nvidia-docker 的版本号?

10得票2回答
使用垂直同步(OpenGL)时,CPU利用率达到100%

这是一个非常简单的测试程序。当禁用垂直同步时,此程序以100FPS运行,并几乎不使用CPU。当我启用垂直同步时,我获得60FPS和25%(4核系统上1个核心的100%)的CPU利用率。这是使用Nvidia GPU。在网上搜索后,有人建议在Nvidia控制面板内禁用“多线程优化”。这确实降低了C...

9得票3回答
CUDA中常量内存的动态分配

我试图利用常量内存,但是我很难弄清楚如何嵌套数组。我有一个数据数组,其中包含内部数据的计数,但每个条目的计数都不同。 基于以下简化代码,我有两个问题。首先,我不知道如何分配由我的数据结构成员指向的数据。其次,由于无法对常量内存使用cudaGetSymbolAddress,我不确定是否可以仅传递...

11得票2回答
如何在使用tensorflow的keras中禁用GPU?

我希望比较我的代码在使用和不使用GPU时的处理时间。我使用Tensorflow作为keras的后端,因此它会自动使用GPU。我使用keras/examples/mnist_mlp.py模型进行比较。 我已经检查了如下的处理时间。那么,如何禁用GPU?应该修改~/.keras/keras.js...

7得票2回答
Qt Creator中应用程序输出显示:NVD3DREL: GR-805:DX9覆盖已禁用。

我正在处理我的项目,我注意到当我运行我的应用程序时,在 Application Output 区域内可以看到以下信息: NVD3DREL: GR-805 : DX9 Overlay is DISABLED NVD3DREL: GR-805 : DX9 Overlay is DISABLE...

7得票2回答
DRAM吞吐量和全局内存吞吐量有什么区别?

CUDA profiler使用四个度量标准来报告内核实际吞吐量,它们是: - 全局内存读吞吐量 - 全局内存写吞吐量 - DRAM读取吞吐量 - DRAM写入吞吐量 《CUDA C最佳实践指南》将全局内存读/写吞吐量描述为实际吞吐量,并未对DRAM读/写吞吐量进行具体说明。 《CUPTI...