在Google Colab上请求特定类型的GPU

5

我正在使用Google Colab运行一些深度学习代码。

前几天它还可以运行,但最近在没有改变代码的情况下我遇到了错误:

RuntimeError: CUDA call failed (correlation_forward_cuda at correlation_cuda.cc:80)

显然,这是一个错误,可能会根据您用来运行代码的显卡或系统而出现。

在Google Colab上,我只需重新启动运行时并再次尝试代码即可。这一次它确实可以工作 - 所以我只是怀疑这取决于是否分配了与GPU兼容的GPU, 看起来是纯属运气问题。

问题在于现在每次运行代码时,无论我重启多少次运行时、关闭我的笔记本电脑或将运行时类型更改为“None”,然后再更改回GPU,我都会收到错误消息。

是否有一种方法可以请求特定类型的GPU?我还不确定是什么类型 - 但肯定有一个版本曾经成功地运行了我的代码。

我的代码需要一段时间才能达到失败点,所以一遍遍地运行代码希望它能够奏效非常令人沮丧。


请提供一个自包含的示例,以重现您观察到的错误。 - Bob Smith
1个回答

3

无法选择特定的GPU。在连接到VM后,您可以使用以下命令检查分配的GPU:

!nvidia-smi --query-gpu=gpu_name,driver_version,memory.total --format=csv

如果您得到的结果不是您想要的,您可以在“管理会话”菜单中终止机器(如果按钮无效,请刷新页面)。如果运气好,通过重新连接到另一台机器,您将获得所需的GPU,否则您可以重复该过程直到成功为止。

我看到您发布的链接与DAIN应用程序有关。我不知道具体情况或者您是否正在尝试执行它,但我在Colab上尝试了DAIN网络,仅使用P1000和P4才能工作。T4和K80失败并抛出了您提到的相同错误。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接