我一直在尝试为我的RTX 2070 GPU设置Julia的CUDA计算,到目前为止,在执行CUDA并行化代码时没有出现任何与失败的CUDA初始化相关的错误。然而,并行计算似乎非常慢,所以我从Julia中启动了Pkg.test("CUDA")
来获取更多关于其原因的见解,以下是一些结果的截图:Julia CUDA test。与CPU相比,GPU的分配似乎完全可以忽略不计。
这也反映在CUDA vs. CPU使用上 - 运行nvidia-smi
显示0%的瞬态GPU利用率,而资源监视器中的CPU在整个测试过程中始终保持在80%以上。
此外,任务管理器中的CUDA利用率图表仅显示CUDA利用率的突发而非连续使用:Screenshot of CUDA utilization in task manager。
对于为什么会出现这种情况,有什么建议吗?我已经多次验证了正确的CUDA包和驱动程序安装,但下一步该怎么做我不确定。
Pkg.test("CUDA")
中的每个测试都旨在为给定的 Julia 函数执行大量的 CUDA 计算。您是说,几 GB 的 CPU 分配与 0.00 MB 的 GPU 分配(在第一个截图中可见)反映了昂贵的编译过程吗?我假设测试套件中至少会有一个测试会使 GPU 承受巨大的负载,但最终没有任何测试这样做。 - t3tcbr