我正在编写一个
基本上,我是从
在 OpenCL 中: CL_DEVICE_MAX_WORK_GROUP_SIZE:1024
在 CUDA 中,不需要内核信息就可以返回该值。 我需要一个与 OpenCL 等效的函数。 提前致谢。
OpenCL
代码,以找到最佳的工作组大小,以在 GPU 上实现最大的利用率。为此,我需要一个函数来返回每个计算单元的最大工作项数。基本上,我是从
CUDA
代码中推导出这个值的,我想要一个等价于 maxThreadsPerMultiProcessor
的函数。
在 CUDA 中,设备查询返回了以下值:
每个多处理器的最大线程数:2048
每个块的最大线程数:1024在 OpenCL 中: CL_DEVICE_MAX_WORK_GROUP_SIZE:1024
在 CUDA 中,不需要内核信息就可以返回该值。 我需要一个与 OpenCL 等效的函数。 提前致谢。