我是一个OpenCL的初学者,对某些内容感到困惑。
我想要提高主机和设备之间图像传输的效率。
我画了一个示意图以更好地理解我的问题。
上方:现在的情况 | 下方:我想要的情况 HtD(主机到设备)和DtH(设备到主机)是内存传输。 K1和K2是内核。
我考虑使用映射内存,但第一次传输(从主机到设备)是通过clSetKernelArg()命令完成的,是吗? 还是我需要将输入图像分成子图像并使用映射来获取输出图像?
谢谢。
编辑:更多信息
K1处理内存输入图像。 K2处理K1的输出图像。
所以,我想将MemInput分成几部分给K1处理。 并且我想读取并保存由K2处理的MemOuput。
上方:现在的情况 | 下方:我想要的情况 HtD(主机到设备)和DtH(设备到主机)是内存传输。 K1和K2是内核。
我考虑使用映射内存,但第一次传输(从主机到设备)是通过clSetKernelArg()命令完成的,是吗? 还是我需要将输入图像分成子图像并使用映射来获取输出图像?
谢谢。
编辑:更多信息
K1处理内存输入图像。 K2处理K1的输出图像。
所以,我想将MemInput分成几部分给K1处理。 并且我想读取并保存由K2处理的MemOuput。