在Nvidia设备上,OpenCL与CUDA的性能比较

4
我编写了一个程序来创建颜色查找表。我使用CUDA和OpenCL进行编码,从我的角度来看,这两个程序几乎是相同的,即使用相同数量的常量内存,全局内存,相同的循环和分支代码等。
我测量了运行时间,CUDA比OpenCL稍微快一些。我的问题是,使用CUDA+NvidiaGPU是否比OpenCL+NvidiaGPU更快,因为CUDA是编写此类GPU的本地方式?
您能否分享一些相关信息的链接?

你能分享一下信息吗?一个相对于另一个有多快?你能比较内核生成的汇编代码(PTX)吗? - isti_spl
1个回答

3

我认为两者应该具有非常相似的性能,但在您发布的两篇论文中,显然通过移植代码,CUDA比OpenCL始终运行得更快。不过,如果我们调整代码,我们可以实现相等的性能。 - BRabbit27

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接