我在我的K20上遇到了关于并发内核执行资源的问题。我的流只有一点重叠,然后我认为这可能是由于资源限制造成的。所以我查阅了手册,并发现以下信息:每个多处理器的最大常驻块数为16,每个多处理器的最大常驻线程数为2048。
我的问题是:如果我有一个包含96个块,每个块中有1024个线程的内核。这个内核会同时使用多少个SM?
答案1:96/16 = 6
答案2:1024/2048*96 = 48(K20仅有13个SM,那么这个内核会如何表现?)
或者您可能有另一个答案?
我的问题是:如果我有一个包含96个块,每个块中有1024个线程的内核。这个内核会同时使用多少个SM?
答案1:96/16 = 6
答案2:1024/2048*96 = 48(K20仅有13个SM,那么这个内核会如何表现?)
或者您可能有另一个答案?