在Google Colab上请求特定类型的GPU

Question

5

我正在使用Google Colab运行一些深度学习代码。

前几天它还可以运行，但最近在没有改变代码的情况下我遇到了错误：

RuntimeError: CUDA call failed (correlation_forward_cuda at correlation_cuda.cc:80)

在Google Colab上，我只需重新启动运行时并再次尝试代码即可。这一次它确实可以工作 - 所以我只是怀疑这取决于是否分配了与GPU兼容的GPU, 看起来是纯属运气问题。

问题在于现在每次运行代码时，无论我重启多少次运行时、关闭我的笔记本电脑或将运行时类型更改为“None”，然后再更改回GPU，我都会收到错误消息。

是否有一种方法可以请求特定类型的GPU？我还不确定是什么类型 - 但肯定有一个版本曾经成功地运行了我的代码。

我的代码需要一段时间才能达到失败点，所以一遍遍地运行代码希望它能够奏效非常令人沮丧。

- user1551817

请提供一个自包含的示例，以重现您观察到的错误。 - Bob Smith

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Juan Diego Lozano · Accepted Answer

无法选择特定的GPU。在连接到VM后，您可以使用以下命令检查分配的GPU：

!nvidia-smi --query-gpu=gpu_name,driver_version,memory.total --format=csv

如果您得到的结果不是您想要的，您可以在“管理会话”菜单中终止机器（如果按钮无效，请刷新页面）。如果运气好，通过重新连接到另一台机器，您将获得所需的GPU，否则您可以重复该过程直到成功为止。

我看到您发布的链接与DAIN应用程序有关。我不知道具体情况或者您是否正在尝试执行它，但我在Colab上尝试了DAIN网络，仅使用P1000和P4才能工作。T4和K80失败并抛出了您提到的相同错误。