8得票1回答
使用统一共享内存而不是设备内存时,SYCL 的性能下降了 4000%。

在SYCL中,有三种类型的内存:主机内存、设备内存和统一共享内存(USM)。对于主机和设备内存,数据交换需要显式复制。与此同时,从USM到设备和从设备到USM的数据移动由SYCL运行时隐式管理。 不幸的是,在使用SYCL为数值核心实现GPU加速的过程中,我发现只是从`sycl::malloc...