这个话题是GPU架构社区中的一个开放性研究。人们在此处评估了几种warp调度策略。请参考以下最近的论文,了解不同调度策略的优缺点: 有人建议使用两级warp调度以提高能效:Energy-efficient Mechanisms for Managing Thread Context in Throughput Processors 有人建议使用两级warp调度以改善延迟隐藏:Improving GPU Performance via Large Warps and Two-Level Warp Scheduling 还有一些人建议按照减少SM L1缓存争用的顺序调度warp: Cache-Conscious Wavefront Scheduling"> 最后,这里有一个专利来自NVIDIA研究人员,提出了一个调度器以提高延迟隐藏和能效。 回答你的问题,这两种策略都可以在任何架构中使用。但真正的底层尚未公开披露。