错误:在EC2 g2.2xlarge上安装CUDA后无法插入“nvidia_352”

9

在启动Ubuntu Server 14.04 LTS (HVM)后,我尝试按照以下步骤安装CUDA

wget http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1404/x86_64/cuda-repo-ubuntu1404_7.5-18_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1404_7.5-18_amd64.deb
sudo apt-get update
sudo apt-get install -y cuda
export PATH=/usr/local/cuda-7.5/bin:$PATH 
export LD_LIBRARY_PATH=/usr/local/cuda-7.5/lib64:$LD_LIBRARY_PATH
sudo reboot

接下来我会运行一个测试

cuda-install-samples-7.5.sh .
cd ~/NVIDIA_CUDA-7.5_Samples/1_Utilities/deviceQuery 
make  
./deviceQuery

我收到了错误信息:

modprobe:错误:无法插入“nvidia_352”:模块中未知的符号或未知的参数(请参见dmesg)cudaGetDeviceCount返回38->未检测到支持CUDA的设备。

这里可能出了什么问题?


你找到解决方案了吗? - Anoracx
2
CUDA 7.5和AWS GPU实例存在问题。看起来Nvidia正在研究此问题。目前,CUDA 7应该可以正常工作。 - rafarr
2
@osondoar:你可以将其添加为答案,以便将此问题从未回答列表中移除。 - talonmies
1
EC2 g2.2xlarge上的cuda 7.5现在应该可以使用352.63或更高版本的驱动程序。 - Robert Crovella
1
@RobertCrovella:你想给这个社区维基的回答点赞,这样它就会从未回答列表中消失(或者如果你愿意的话,你可以添加自己的回答,我会投票并删除我的)。 - talonmies
显示剩余2条评论
2个回答

10

在安装nvidia驱动之前,需要升级Ubuntu并安装linux-image-extra。

sudo apt-get update && sudo apt-get -y upgrade sudo apt-get install -y linux-image-extra-`uname -r`

你是否确实确认在运行CUDA 7.5版本的Ubuntu 14.04 LTS上的EC2 g2.2xlarge实例上,这个工作是有效的? - talonmies
这对我来说是解决方案! - Grant Bartel

2
似乎在AWS GPU实例中,CUDA 7.5存在一个问题。暂时的解决方法似乎是降级到CUDA 7。
2015年12月编辑以添加来自NVIDIA的Robert Crovella的建议,即在EC2 g2.2xlarge上使用CUDA 7.5现在应该是可用的,只需更新驱动程序即可解决此问题。
[本答案是从评论中组合而成,并作为社区wiki条目添加,以将此问题列入未回答的列表中]

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接