数值错误:未知的CUDA架构(8.6)或不支持的GPU

3
当我在我的conda环境中构建DCNv2时,我收到了这个消息。
我已经通过nvidia-smi检查了cuda:
Tue Apr  6 20:03:13 2021       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.67       Driver Version: 460.67       CUDA Version: 11.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  GeForce RTX 3070    Off  | 00000000:01:00.0  On |                  N/A |
|  0%   45C    P8    17W / 220W |    448MiB /  7979MiB |     23%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|    0   N/A  N/A       955      G   /usr/lib/xorg/Xorg                 53MiB |
|    0   N/A  N/A      1555      G   /usr/lib/xorg/Xorg                210MiB |
|    0   N/A  N/A      1690      G   /usr/bin/gnome-shell               61MiB |
|    0   N/A  N/A      3564      G   ...AAAAAAAAA= --shared-files      108MiB |

以及 nvcc -V:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2019 NVIDIA Corporation
Built on Sun_Jul_28_19:07:16_PDT_2019
Cuda compilation tools, release 10.1, V10.1.243

任何帮助吗?

3
CUDA 10.1不支持您的GPU。 - talonmies
2个回答

5

您的GPU对于CUDA 10来说“太新了”。像您的这样具有计算能力8.6的卡片的支持在CUDA 11.1中被添加(感谢@RobertCrovella进行更正)。这意味着您需要使用CUDA 11.1或更新版本。


我将CUDA升级到11.3.1,但仍然收到关于“CUDA arch(8.6)”的相同错误消息。您知道为什么会发生这种情况吗? - jtb
2
假设这与PyTorch有关,请记住PyTorch 不会使用您系统的CUDA。它会安装自己的版本以及PyTorch二进制文件。有关如何让PyTorch与CUDA配合工作的更多详细信息,请参见此答案此答案 - jodag

-1

您可以编辑cpp_extension.py,例如"/usr/local/conda3/lib/python3.7/site-packages/torch/utils/cpp_extension.py",并将8.6添加到列表中。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接