当安装了Nvidia驱动程序后,Ubuntu在登录后卡住。

我在我的超微SuperServer(7047GR-TPRF)上安装了2张显卡(Tesla K10、K40)。我安装了Ubuntu Server 14.04,但当我安装cuda或Nvidia图形驱动程序(版本311或340)时,我的Ubuntu桌面登录时会卡住。


你能在问题中包含你所遵循的步骤吗?可以通过查看“历史记录”或包括任何你所遵循的指示来实现吗? - jmunsch
2个回答

你的问题可能是由于官方NVIDIA CUDA下载网站提供的NVIDIA专有图形驱动程序引起的。这个驱动程序已知会在Ubuntu中导致冻结和黑屏。所以尝试使用来自Ubuntu软件中心的NVIDIA专有图形驱动程序和NVIDIA CUDA工具包。
Ubuntu软件中心提供的NVIDIA CUDA工具包版本为5.5,不如官方NVIDIA CUDA下载网站上的6.5版本更新,但更加稳定可靠。同样,Ubuntu软件中心提供的专有NVIDIA图形驱动程序也是如此,最新版本为nvidia-331。
  1. 从挂起的登录界面上通过键盘组合键 Ctrl+Alt+F3 进入纯文本虚拟控制台,然后你会看到一个只显示登录提示符的纯文本控制台。在登录提示符处使用你的用户名和密码登录控制台。

  2. 从纯文本控制台中卸载NVIDIA专有图形驱动程序。找到你从NVIDIA网站下载并安装NVIDIA图形驱动程序的文件。它应该位于你下载到的文件夹中(例如你的下载文件夹)。文件名可能类似于NVIDIA-Linux-x86-340.58.run。如果是这样,卸载它的命令是:

    sudo ~/Downloads/NVIDIA-Linux-x86-340.58.run --uninstall  
    sudo reboot 
    

    如果NVIDIA-Linux-x86-XXX.XX.run文件具有不同的名称或位置,请在上述命令中更改名称和/或位置。上述命令中的.run文件的名称和位置必须与计算机中的.run文件的名称和位置完全匹配。

  3. 重启后,卸载之前安装的所有CUDA软件包。没有来自NVIDIA网站的NVIDIA专有驱动程序,它们将无法正常工作,因此您需要从Ubuntu软件中心安装CUDA软件包。

  4. 确定适用于您系统的推荐专有图形驱动程序。打开终端并输入:

    ubuntu-drivers devices  
    
  5. Ubuntu需要nvidia-331或更高版本的图形驱动程序,因此如果要安装CUDA软件包,您只能选择这些NVIDIA图形驱动程序。安装推荐的NVIDIA专有图形驱动程序并重新启动。

  6. 如果您已经安装了nvidia-331或更高版本的NVIDIA图形驱动程序,请安装CUDA软件包。打开终端并输入:

    sudo apt-get install libcudart5.5 nvidia-cuda-toolkit  
    

就这些了。要做的事情很多,但如果您在使用命令ubuntu-drivers devices安装之前确定了正确的图形驱动程序,所有这些都可以避免。


P.S. 希望你在从官方 NVIDIA CUDA 下载网站安装 CUDA 包后没有更改终端中的任何 PATH 变量。如果你确实在终端中更改了 PATH 变量,请留言告诉我,这样我就可以告诉你如何将其恢复原样。

是的,我已经按照NVIDIA网站上的建议更改了路径。 - Amol Punde
在从Ubuntu软件中心安装CUDA包时,你不需要手动更改任何PATH变量,因为这是作为安装的一部分自动完成的。否则,如果在从NVIDIA CUDA下载网站安装CUDA包之后手动更改了任何PATH变量,你可以通过阅读NVIDIA CUDA Linux v6.5入门指南第6.1章“环境设置”来找到PATH信息。 - karel

如果您选择使用主用户自动登录,这可能会解决问题:
1. 重新启动并在启动菜单中选择“其他选项” -> 救援模式 2. 进入设置 -> 用户,并禁用自动登录