我能列出以下参数,这些参数有助于根据设备内存限制工作项:
注:我对其中一些参数有简要了解,但不确定我的理解是否正确。
- CL_DEVICE_GLOBAL_MEM_SIZE (全局内存大小)
- CL_DEVICE_LOCAL_MEM_SIZE (本地内存大小)
- CL_DEVICE_MAX_CONSTANT_BUFFER_SIZE (常量缓冲区最大大小)
- CL_DEVICE_MAX_MEM_ALLOC_SIZE (最大内存分配大小)
- CL_DEVICE_MAX_WORK_GROUP_SIZE (最大工作组大小)
- CL_DEVICE_MAX_WORK_ITEM_SIZES (最大工作项大小)
- CL_KERNEL_WORK_GROUP_SIZE (内核工作组大小)
注:我对其中一些参数有简要了解,但不确定我的理解是否正确。
global = 1073741824``local = 1024
。就这样。硬件将在N个计算单元中顺序运行1M个工作组(如果只有4个,则每个周期只处理4个),直到完成。 - DarkZeros