在Ubuntu中使用CUDA的deviceQuery失败

3

当前操作系统为Ubuntu 14.04.02 LTS。我按照http://docs.nvidia.com/cuda/cuda-getting-started-guide-for-linux/#ubuntu-installation的指导安装了CUDA。然而,在执行后续操作中的deviceQuery时,出现了以下消息:

cudaGetDeviceCount returned 38
-> no CUDA-capable device is detected
Result = FAIL

安装指南中提到可能会出现/dev/nvidia*的问题,所以我运行了/dev$ ls -l nvidia*命令:
crw-rw-rw- 1 root root 195,   0  6月 25 20:58 nvidia0
crw-rw-rw- 1 root root 195, 255  6月 25 20:58 nvidiactl

此外,nvidia-smi -a:

Failed to initialize NVML: GPU access blocked by the operating system

现在我不知道出了什么问题。有人能给我建议吗?

1个回答

4
我的显卡: 1. Tesla K40 2. Quadro FX580
我也遇到了同样的问题,花费了我数小时才找到解决方法。我的解决方案是,你可能需要将CUDA版本从7.0降低到6.5或者更低的5.5。
出现这种情况的原因是由于某些未知原因,你的显卡(其中一个)只能与低于346版本的Nvidia驱动程序配合良好,例如340版本。然而,对于CUDA 7.0/6.5,你需要346版本。这个问题矛盾自身。我遇到了这种情况,并且有无限的登录循环问题(基本上,无法登录我的计算机)。
你需要做以下操作: 1. 如果你无法在GUI中登录,请按Ctrl+Alt+F1/F3进入命令行。 2. 在终端中登录,然后输入sudo apt-get install nvidia-cuda-toolkit。(这将安装340版本的驱动程序,帮助你解决无限登录屏幕问题 <-- 然而这不允许你使用Cuda7.0,我相信)。 3. 一旦你能够登录,请输入cd /usr/local --> rm -rf cuda7.0。 4. sudo apt-get install cuda6.5(他们将强制你再次安装版本346)。 5. sudo apt-get install nvidia-340(稍微低级的驱动程序;在安装时,它将删除cuda6.5和一些其他文件,但不是全部)。 6. nvidia-smi <-- 现在你应该能够看到两个显卡。然而,你缺少CUDA。 7. nvcc <-- 这应该会给你一个错误和建议的解决方案。类似于“输入sudo apt-get install nvidia-cuda-toolkit”。按照提示操作,你应该能够安装cuda5.5。 8. 现在,至少你可以使用一个好的显卡和一个坏的显卡进行cuda5.5。
注意:你可能会遇到gcc出现问题的情况。例如,他们可能不接受gcc4.8.2,而是gcc4.8.4。请注意这一点。
有时候,遇到这种矛盾的问题很令人沮丧,其中驱动程序不支持一个显卡而不支持另一个显卡,并且还有其他依赖项。我花了很长时间才找到解决方法。希望这能帮到你!
更新于10/03/15。
所以,我尝试使用Cuda5.5运行caffe。它出现了非常奇怪的问题,我相信这是因为cuda版本太低了。所以,我又尝试将其更新到6.5。所以,我成功地安装了cuda6.5,按照以下步骤进行:
  1. 预先安装340.93 Nvidia驱动程序。
  2. 下载cuda6.5 https://developer.nvidia.com/cuda-toolkit-65
  3. 确保使用gcc 4.4.7。gcc 4.8.4不可用。按照此处的说明执行。
  4. 安装您为cuda下载的.run文件。确保不要安装安装程序推荐的340.29驱动程序。
  5. 安装完成后,运行sudo nvidia-smi以确保它正常运行。重新启动计算机。完成。

这在我的Ubuntu 14.04电脑上与Tesla K40c和Quadro FX580一起使用。


更新于10/01/15。今天我安装了更新的340.93版(之前是340.76版)。不确定为什么会出现同样的问题(可能是我使用gcc4.4编译的原因)。所以我下载了340.76版并尝试安装,但它提示我需要gcc4.8而我只有gcc4.4。于是我更换到gcc4.8然后重新安装了340.76版。一旦成功,我就可以再次登录电脑了。耶! - user3559191
更新于10/03/15。我尝试使用Cuda5.5运行caffe,但出现了一个非常奇怪的问题,我认为这是因为cuda版本太低了。所以我又尝试升级到6.5版本。最终,我成功地安装了cuda6.5,并按照我的文章中的更新进行了操作。 - user3559191

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接