我编写了一个程序来创建颜色查找表。我使用CUDA和OpenCL进行编码,从我的角度来看,这两个程序几乎是相同的,即使用相同数量的常量内存,全局内存,相同的循环和分支代码等。
我测量了运行时间,CUDA比OpenCL稍微快一些。我的问题是,使用CUDA+NvidiaGPU是否比OpenCL+NvidiaGPU更快,因为CUDA是编写此类GPU的本地方式?
您能否分享一些相关信息的链接?
我测量了运行时间,CUDA比OpenCL稍微快一些。我的问题是,使用CUDA+NvidiaGPU是否比OpenCL+NvidiaGPU更快,因为CUDA是编写此类GPU的本地方式?
您能否分享一些相关信息的链接?