如何解释关于 NVIDIA GPU 的 `nvidia-smi` 图表?

3
我刚在一台安装有两个K20m GPU的服务器上运行了simpleMultiGPU,并运行了nvidia-smi命令以显示GPU的状态。结果如下所示:
问题如下:
1. GPU记忆使用似乎不同。 2. 设备1的揮发GPU-Util为99%。
有什么建议吗?

simpleMultiGPU会在控制台打印什么?很有可能它只是没有为两个GPU生成足够的工作。 - Jonas Bötel
嗨,谢谢!simpleMultiGPU 的控制台输出在 generating input data ... 时被阻塞了,我等了五分钟左右,它还停在那里,期间我也使用了 nvidia-smi 来检查状态,似乎没有任何变化。然后我使用 Ctrl+C 来停止进程。 - mining
1个回答

4
  1. 没有任何概念规定在多个GPU上运行应用程序时内存利用率必须相同。此外,在应用程序的不同阶段,内存利用率可能会有所变化,具体取决于在测量内存使用情况时所发生的基础活动(例如进行分配的时间点)。

  2. 设备1的Volatile GPU使用情况可能表明应用程序和/或nvidia-smi正在设备1上产生活动。

不清楚为什么您将这些称之为问题。您正在监视设备上的活动。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接