我有一个CUDA程序,如果我使用-g -G选项编译该程序,我可以获得正确的输出。如果我没有使用-g -G选项编译它,我不总是得到正确的输出。我的猜测是没有-g -G选项,编译器将优化程序并导致竞争条件。可以有人确认这一点,并让我知道如果我不使用-g -G选项编译程序,应该怎么做才能产生正确的输出。谢谢。
操作系统:x86_64 GNU / Linux CUDA版本:4.0 设备:Geforce 200,它是连接到机器上的GPU之一,我认为它不是显示设备。
操作系统:x86_64 GNU / Linux CUDA版本:4.0 设备:Geforce 200,它是连接到机器上的GPU之一,我认为它不是显示设备。