我刚在一台安装有两个K20m GPU的服务器上运行了simpleMultiGPU,并运行了nvidia-smi命令以显示GPU的状态。结果如下所示:问题如下:1. GPU记忆使用似乎不同。 2. 设备1的揮发GPU-Util为99%。有什么建议吗?
没有任何概念规定在多个GPU上运行应用程序时内存利用率必须相同。此外,在应用程序的不同阶段,内存利用率可能会有所变化,具体取决于在测量内存使用情况时所发生的基础活动(例如进行分配的时间点)。 设备1的Volatile GPU使用情况可能表明应用程序和/或nvidia-smi正在设备1上产生活动。 不清楚为什么您将这些称之为问题。您正在监视设备上的活动。
simpleMultiGPU
的控制台输出在generating input data ...
时被阻塞了,我等了五分钟左右,它还停在那里,期间我也使用了nvidia-smi
来检查状态,似乎没有任何变化。然后我使用Ctrl+C
来停止进程。 - mining