我试图使用Nvidia Visual Profiler在Windows上对仅使用cuBLAS的应用程序进行性能分析,但它显示我的应用程序根本没有使用GPU!也就是说,时间轴完全为空,除了性能分析开销之外。为了确保没有人更改了我的安全设置或其他设置,我分析了一个包含内核和cudaMemcpy调用的应用程序,并成功进行了分析。出现了什么情况?我是否缺少某些设置?链接到错误版本的cuBLAS库?还是它实际上没有调用GPU(虽然这对我来说似乎完全不可能...)?如果有64位支持,则使用英特尔编译器。谢谢!