今天我在内核中添加了四个更多的
我进一步尝试仅添加两个较小变量中的一个。如果我只添加其中一个,它可以正常工作,但如果我添加两个,它会崩溃。
那么,OpenCL的这种行为是否意味着我分配了太多的
__local
变量,以便倾倒中间结果。但是,只将这四个变量添加到内核签名中,并添加相应的内核参数,会使内核的所有输出都变为“0”。没有任何cl函数返回错误代码。我进一步尝试仅添加两个较小变量中的一个。如果我只添加其中一个,它可以正常工作,但如果我添加两个,它会崩溃。
那么,OpenCL的这种行为是否意味着我分配了太多的
__local
内存?如何找出我可以使用多少__local
内存?
clinfo
中被报告为“本地内存大小”。 - user2580621