我在使用OpenCL/OpenGL互操作时遇到了多GPU的问题。我正在尝试编写一个应用程序,以呈现密集计算的结果。最终它将运行一个优化问题,并根据结果将某些内容渲染到屏幕上。作为一个测试案例,我从这个课程中开始使用粒子模拟示例代码:http://web.engr.oregonstate.edu/~mjb/sig13/
示例代码创建了一个OpenGL上下文,然后创建了一个OpenCL上下文,共享状态,使用cl_khr_gl_sharing扩展。当我使用单个GPU时,一切正常。创建上下文的方式如下:
稍后,示例将使用clCreateFromGLBuffer创建共享的CL/GL缓冲区。
现在,我想从两个GPU设备创建上下文:
这是由cl_khr_gl_sharing扩展添加的错误代码。在扩展描述(上面链接的)中,它说:
CL_INVALID_OPERATION如果为CGL、EGL、GLX或WGL之一指定了上下文或共享组对象,并且满足以下任何条件:
- OpenGL实现不支持指定上下文或共享组对象的窗口系统绑定API。 - CL_CGL_SHAREGROUP_KHR、CL_EGL_DISPLAY_KHR、CL_GLX_DISPLAY_KHR和CL_WGL_HDC_KHR属性中有多个属性设置为非默认值。 - CL_CGL_SHAREGROUP_KHR和CL_GL_CONTEXT_KHR两个属性都设置为非默认值。 - 参数中指定的任何设备都不能支持共享OpenGL对象数据存储的OpenCL对象,如第9.12节所述。
这个描述似乎不完全符合我的情况。无法使用多个GPU进行OpenCL/OpenGL互操作吗?还是我有异构硬件?我从枚举设备中打印出了一些参数。我只是拿到手的两个随机GPU。
请注意,如果我创建上下文时没有使用Interop部分(使props数组看起来像下面这样),那么它可以成功地创建上下文,但显然无法与应用程序的OpenGL端共享缓冲区。
3. create an opencl context based on the opengl context:
cl_context_properties props[ ] =
{
CL_GL_CONTEXT_KHR, (cl_context_properties) glXGetCurrentContext( ),
CL_GLX_DISPLAY_KHR, (cl_context_properties) glXGetCurrentDisplay( ),
CL_CONTEXT_PLATFORM, (cl_context_properties) Platform,
0
};
cl_context Context = clCreateContext( props, 1, Device, NULL, NULL, &status );
if( status != CL_SUCCESS)
{
PrintCLError( status, "clCreateContext: " );
exit(1);
}
稍后,示例将使用clCreateFromGLBuffer创建共享的CL/GL缓冲区。
现在,我想从两个GPU设备创建上下文:
cl_context Context = clCreateContext( props, 2, Device, NULL, NULL, &status );
我已成功打开设备,并可以查询它们都支持cl_khr_gl_sharing,且单独工作良好。然而,在尝试像上面那样创建上下文时,出现了以下问题:
CL_INVALID_OPERATION
这是由cl_khr_gl_sharing扩展添加的错误代码。在扩展描述(上面链接的)中,它说:
CL_INVALID_OPERATION如果为CGL、EGL、GLX或WGL之一指定了上下文或共享组对象,并且满足以下任何条件:
- OpenGL实现不支持指定上下文或共享组对象的窗口系统绑定API。 - CL_CGL_SHAREGROUP_KHR、CL_EGL_DISPLAY_KHR、CL_GLX_DISPLAY_KHR和CL_WGL_HDC_KHR属性中有多个属性设置为非默认值。 - CL_CGL_SHAREGROUP_KHR和CL_GL_CONTEXT_KHR两个属性都设置为非默认值。 - 参数中指定的任何设备都不能支持共享OpenGL对象数据存储的OpenCL对象,如第9.12节所述。
这个描述似乎不完全符合我的情况。无法使用多个GPU进行OpenCL/OpenGL互操作吗?还是我有异构硬件?我从枚举设备中打印出了一些参数。我只是拿到手的两个随机GPU。
PlatformID: 18483216
Num Devices: 2
-------- Device 00 ---------
CL_DEVICE_NAME: GeForce GTX 285
CL_DEVICE_VENDOR: NVIDIA Corporation
CL_DEVICE_VERSION: OpenCL 1.0 CUDA
CL_DRIVER_VERSION: 304.88
CL_DEVICE_MAX_COMPUTE_UNITS: 30
CL_DEVICE_MAX_CLOCK_FREQUENCY: 1476
CL_DEVICE_TYPE: CL_DEVICE_TYPE_GPU
-------- Device 01 ---------
CL_DEVICE_NAME: Quadro FX 580
CL_DEVICE_VENDOR: NVIDIA Corporation
CL_DEVICE_VERSION: OpenCL 1.0 CUDA
CL_DRIVER_VERSION: 304.88
CL_DEVICE_MAX_COMPUTE_UNITS: 4
CL_DEVICE_MAX_CLOCK_FREQUENCY: 1125
CL_DEVICE_TYPE: CL_DEVICE_TYPE_GPU
cl_khr_gl_sharing is supported on dev 0.
cl_khr_gl_sharing is supported on dev 1.
请注意,如果我创建上下文时没有使用Interop部分(使props数组看起来像下面这样),那么它可以成功地创建上下文,但显然无法与应用程序的OpenGL端共享缓冲区。
cl_context_properties props[ ] =
{
CL_CONTEXT_PLATFORM, (cl_context_properties) Platform,
0
};