如何在Ubuntu上配置Nvidia RTX 2080 Ti?

我两天前买了一台RTX 2080ti,之前用的是两个GTX 1080,运行我的TensorFlow程序没有任何问题。但是换成RTX 2080ti后,系统无法找到该设备的驱动程序,lshw显示如下:
  *-display UNCLAIMED       
       description: VGA compatible controller
       product: NVIDIA Corporation
       vendor: NVIDIA Corporation
       physical id: 0
       bus info: pci@0000:01:00.0
       version: a1
       width: 64 bits
       clock: 33MHz
       capabilities: pm msi pciexpress vga_controller cap_list
       configuration: latency=0
       resources: memory:de000000-deffffff memory:c0000000-cfffffff memory:d0000000-d1ffffff ioport:e000(size=128) memory:c0000-dffff
我尝试从PPA手动安装一些驱动程序,但没有任何效果。
这是我的电脑问题还是确实还没有支持该设备?
我的系统版本是18.04。
谢谢。

你试过哪个PPA?你是想使用NVIDIA的专有驱动程序还是开源的nouveau驱动程序? - Kristopher Ives
尝试了ppa:graphics-drivers/pap,使用了390和384驱动程序而不是nouveau。我还注意到当我尝试重新安装系统时,nouveau显示未知芯片组。 - stepstone
1这篇文章说图灵卡需要驱动版本410。它还告诉了如何安装带有该驱动的CUDA软件包。 - Chai T. Rex
谢谢兄弟。你救了我的一天,我以为ppa与官方驱动程序同步了。从Nvidia网站下载了驱动程序,现在通过anaconda一切都完美无缺。 - stepstone
2个回答

我写了一篇完整的文章,介绍了如何在Ubuntu上安装RTX 2080系列GPU的驱动程序和CUDA。主要是因为对于一些(大多数?)用户来说,这可能是一项耗时的任务。建议您按照文章中的步骤进行操作。
我在Ubuntu-16.04和18.04上都遇到了同样的问题。在Ubuntu-16.04上,机器没有找到正确的Nvidia驱动程序,而是使用了开源的Nouveau显示驱动程序。因此,您需要从Nvidia官网下载并安装适当的驱动程序。
现在,请按照以下步骤安装驱动程序。
1) cd Downloads/

2) ls
#(NVIDIA-Linux-x86_64–410.57.run #output of ls)

3) chmod +x NVIDIA-Linux-x86_64–410.57.run
#(to get permission to execute the run file)

4) sudo ./NVIDIA-Linux-x86_64–410.57.run --no-x-check

注意:--no-x-check标志很重要。否则,您将不得不禁用x-server并从图形用户界面注销。

驱动程序安装完成后,重新启动计算机,并在终端上使用nvidia-smi命令验证安装。它将显示GPU和已安装的驱动程序信息。

下一步是安装CUDA,有时可能会有些麻烦。您将需要从图形用户界面注销,并在终端上执行所有操作。

从此链接下载与您相关的CUDA运行文件。然后在您的主目录中创建一个名为blacklist-nouveau.conf的文件,并将以下行添加到该文件中。

blacklist nouveau
options nouveau modeset=0

现在我们需要通过按下(ctrl+alt+f1)从GUI注销以安装cuda。输入您的用户名和密码进入终端。
现在请按照以下步骤进行操作。
1) sudo service lightdm stop

2) sudo -i

3) sudo cp /home/avin/blacklist-nouveau.conf /etc/modprobe.d
#change avin with your user name

4) sudo update-initramfs -u

5) exit

6) cd Downloads/

7) md5sum cuda_10.0.130_410.48_linux.run #(Optional)

8) sudo sh cuda_10.0.130_410.48_linux.run

Cuda安装向导将会出现。按照明显的步骤进行操作,同时参考本文。 安装完成后,在此终端上运行reboot
机器重启后,将cuda路径添加至.bashrc中。
1) sudo gedit ~/.bashrc

2) Add following 2 lines at the end of the .bashrc file

export PATH=/usr/local/cuda-10.0/bin${PATH:+:${PATH}}

export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

3) source ~/.bashrc

现在在终端上运行nvcc -V,应该会得到以下输出。 安装消息 既然驱动程序和cuda已经安装好了,你可能想要安装tensorflow的gpu版本。这里有一个非常好的教程,可以帮助你完成相同的任务。

1老版本(提供链接)与Ubuntu 18.10的最新更新不兼容。重新启动后,最新的.run文件运行良好。我建议大家在进行此操作时获取最新的驱动程序构建。 - will

我刚遇到了完全相同的问题,现在我正在运行一个TensorFlow模型来测试它,看起来一切都正常。
我所需要做的就是从Nvidia网站安装驱动程序,并使用sudo运行它。
这是链接 https://www.geforce.com/drivers 我还没有对性能进行任何基准测试,但一切似乎都很好。
而这种方法的一个非常大的缺点是,每次内核更新后都需要重新安装驱动程序!

1你能告诉我你的Ubuntu版本、驱动程序版本和CUDA版本吗? - Mohsin