我正在调试基于CUDA 4.0 / Thrust的图像重建代码,在我的Ubuntu 10.10 64位系统上,我一直在尝试找出如何调试这个运行时错误,其中我的输出图像显示为某些随机的“噪声”。我的代码中没有随机数生成器的输出,因此我希望输出在运行之间保持一致,即使是错误的。然而,它并不是这样的...
我只是想知道是否有任何人对调试CUDA运行时错误(例如这些)有一个通用的过程。我在我的cuda内核中没有使用任何共享内存。我已经努力避免涉及全局内存的任何竞争条件,但我可能会错过一些东西。
我已经尝试使用gpu ocelot,但它无法识别我的一些CUDA和CUSPARSE函数调用。
此外,我的代码通常都是可以工作的。只有当我更改了这个设置时,才会出现这些非确定性结果。我已经检查了与该设置相关的所有代码,但我无法弄清楚我做错了什么。如果我能将其简化为我可以发布的内容,我可能会这样做,但在这一点上,它太复杂了,无法在此处发布。
我只是想知道是否有任何人对调试CUDA运行时错误(例如这些)有一个通用的过程。我在我的cuda内核中没有使用任何共享内存。我已经努力避免涉及全局内存的任何竞争条件,但我可能会错过一些东西。
我已经尝试使用gpu ocelot,但它无法识别我的一些CUDA和CUSPARSE函数调用。
此外,我的代码通常都是可以工作的。只有当我更改了这个设置时,才会出现这些非确定性结果。我已经检查了与该设置相关的所有代码,但我无法弄清楚我做错了什么。如果我能将其简化为我可以发布的内容,我可能会这样做,但在这一点上,它太复杂了,无法在此处发布。