超线程技术与超标量执行

Question

超线程技术与超标量执行

8

想象一下一个CPU（或核心）是超标量的（具有多个执行单元），并且也支持超线程（SMT）。

为什么CPU实际可以并行执行的软件线程数量通常由它拥有的逻辑核数（即所谓的硬件线程）而不是它拥有的全部执行单元的数量来确定？
如果我理解正确，SMT实际上并没有使真正的并行执行成为可能，而是通过复制某些部分的CPU（存储体系结构状态但不包括主要执行资源的部分）使上下文切换变得更快/更高效。另一方面，超标量架构允许在每个时钟周期内真正同时执行多条指令，因为CPU具有多个执行单元，即多个并行流水线，每个流水线可以以真正并行的方式处理一个单独的线程。

因此，例如，如果一个CPU有2个核心，并且每个核心有2个执行单元，那么它的硬件并发性（它可以真正并行执行的线程数）不应该是4吗？为什么它的硬件并发性取决于逻辑核心的数量，而SMT实际上并没有使真正的并行执行成为可能呢？

- AdmiralAdama

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Margaret Bloom · Accepted Answer

您不能只是将指令猛烈地塞进执行单元中。
如果想要一个2路SMT，您需要保持两个架构状态并提取两个指令流。

如果一家公司有100名开发人员但只有两个项目经理，则只能并行开发两个项目（但如果让项目经理每天或每隔一段时间切换项目，则可以同时开发更多项目）。

如果CPU只能从两个指令流中提取（仅保留两个线程上下文），则只能分配两个线程以并行执行。
但是，您可以进行时间分配并同时执行更多线程。

软件无法访问执行单元，这会导致循环论证（软件需要EU来执行，但EU需要软件来执行）。
CPU将尝试尽可能利用EU，利用乱序和假设任何可能的东西。
实际上，超线程只是一种使所有资源保持繁忙的方法（就像在项目经理很闲时与另一个项目经理共享开发人员一样）。

但是，如果所有尝试都失败了，EU未被使用，那么这个可能的工作单元就浪费了。