无法在多个GPU上运行TensorFlow

3
我正在运行来自tensorflow代码库的cifar10多GPU示例,我能够使用超过一个GPU。我的Ubuntu PC有两个Titan X,我看到进程在两个GPU上占用了全部内存。然而,只有一个GPU实际上在计算。我没有获得任何加速。我已经尝试了0.5.0和0.6.0 pip二进制的tensorflow。我还尝试过从源代码编译。
编辑: 在安装旧版nvidia驱动程序后,问题消失了。

cifar10多GPU示例曾经可以在我的机器上运行。但是我安装了更新的Nvidia驱动程序和Tensorflow版本后,它无法利用超过一个GPU。 - read Read
你怎么知道它没有使用第二个GPU?另外,你可以尝试使用log_device_placement=True创建会话。 - Yaroslav Bulatov
@YaroslavBulatov 我通过安装旧版本的Nvidia驱动程序解决了这个问题。顺便说一下,可以使用nvidia-smi检查GPU利用率。 - read Read
1个回答

3

在我安装了一个旧版本(352.55)的Nvidia驱动程序后,问题消失了。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接