为什么 RISC-V 没有用于计算进位的指令？

Question

为什么 RISC-V 没有用于计算进位的指令？

assemblyriscvinstruction-setbignum

9

我需要在RISC-V上进行大数运算（加法和减法，但我将减法视为有符号加法），情况有些复杂。根据我在互联网上半小时的研究，我得到以下结论：

- RISC-V操作没有提供检查进位或溢出的手段。 - 这个决定是由于标志或其他处理方式会给乱序微体系结构增加很多复杂性的缘故。 - 相反，他们建议之后进行分支

- 对于无符号加法，可以使用单个bltu进行溢出处理。 - 如果已知一个操作数的符号，则有符号加法也可以相同处理 - 否则，需要执行两个检查（三个额外指令）

- 互联网上的人对此感到非常愤怒（我这里不会链接）。

据我所知，这些分支确实涵盖了大部分场景，除了一个：（有符号）大数加法。因为在那里，我们在热循环中命中最慢的检查路径。

我只知道一点关于ISA设计的知识，但为什么他们没有包括一个计算(a+b)>>32（实际上是进位）的指令呢？有点像乘法指令被分成mul和mulh一样。这将允许使用始终只有两个指令的所需计算。更强大的微体系结构甚至可以检测序列并只执行一次加法。

我是否错过了使这个指令过时（或等同于它）的一些技巧？它有任何主要缺点吗？我没有找到关于这个一般性话题的很多好文档。

- piegames

就此而言，Waterman的博士论文甚至没有提到进位标志位，只是在虚拟化的背景下讨论了标志寄存器的困难，而不是针对乱序执行。英特尔在2005年已经解决了这个乱序执行的“问题”。为了捍卫RISC-V，大数可能不会出现在他们的基准测试中。 - Olsonist

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Peter Cordes · Accepted Answer

add / sltu指令可以得到和以及进位值：https://godbolt.org/z/Y7f5dzj1P演示了GCC如何使用它进行无符号数学运算：sum=a+b / carry = sum<a。或者使用__builtin_uadd_overflow。

但是这样做的问题是缺乏ILP：直到add结果准备好之前，sltu不能开始。如果可以像您提出的那样直接从输入中获取进位值，那么这个问题就可以解决；非常好的观点。当然合并add/sltu也可以解决这个问题；也许这就是设计师们考虑的。

我认为创建一个根据两个输入的加法产生0或1输出的指令不存在任何CPU设计难题。那将非常容易；支持add指令的任何32位或64位加法器都可以轻松地从高位产生进位信号。事实上，这可能就是sltu读取的内容，因为整数算术逻辑单元通常使用单个二进制加减器，其中一个输入的NOT和一个进位值1用于执行减法。(低位是全加器而不是半加器，否则就是正常的二进制加器。)

对于超过2个寄存器宽度的bignum来说，另一个主要问题是带进位加法（有带进位标志和add-with-carry指令的ISA）。

更糟糕的是，从这3个输入的加法中得到进位值。（其中任何一部分都可能会溢出，所以我认为将其合并为一个加法并进行比较是不可能的。这是纯C实现adc时的常见陷阱；链接答案的评论有可以工作的C代码，但效率不高）。

除非有我不知道的诀窍，否则我认为这才是人们对RISC-V和MIPS等无-FLAGS设计在Bignum方面感到沮丧的真正原因。