不可以。CUDA是一种SIMD风格的架构,其基本执行单元是一个“warp”——由32个线程组成的组合,在硬件上step执行。如果您启动包含单个线程的单个块,则硬件将执行32个线程的单个warp,其中31个被屏蔽并执行无操作流的等效函数。任何给定的warp在单个流多处理器上执行,具体取决于您使用的硬件的代数,这可能涉及到SM上运行的8、16或32个核心。