使用Nvidia平台配置OpenCL的本地(共享)内存

3
我想优化OpenCL内核中的本地内存访问模式。我在某个地方读到了关于可配置本地内存的内容。例如,我们应该能够配置使用多少本地内存和自动缓存。

此外,我在这里阅读到可以为最新(Kepler)Nvidia硬件选择银行大小:http://www.acceleware.com/blog/maximizing-shared-memory-bandwidth-nvidia-kepler-gpus。对于存储在本地内存中的双精度值,这一点似乎非常关键。

Nvidia是否提供设置本地内存专门用于CUDA用户的功能?我找不到类似OpenCL的方法。所以这可能被称为不同的方式或者确实不存在吗?

1个回答

5

很遗憾,在使用OpenCL时,无法控制L1缓存/本地内存配置。这个功能只由CUDA运行时提供(通过cudaDeviceSetCacheConfigcudaFuncSetCacheConfig)。


你确定吗?有任何来源或者证据吗? - user1197918

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接