在C语言中,rvalue存储在哪里?

12

在 C 语言中,我有这段代码:

int a;
a = 10 + 5 - 3
我想问一下:(10+5-3)存储在哪里? (据我所知,a 存储在栈中,那么 (10+5-3) 呢?这个右值是如何计算的?)

我想问一下:(10+5-3)存储在哪里? (据我所知,a 存储在栈中,那么 (10+5-3) 呢?这个右值是如何计算的?)


7
我觉得“code piece”很好笑,这是不是不好? :) - e.James
一个不错的SO参考:https://dev59.com/hHVD5IYBdhLWcg3wHn2d - Derek
@eJames,这可能好也可能不好。我怀疑“codpiece”已经不再普遍使用,许多人甚至可能不知道它是什么(除非他们看过“黑爵士”)。 - paxdiablo
@djbender 这个参考资料是关于栈和堆的,与此无关。正如几个回复所指出的那样,r-value 会作为汇编指令的操作数实现(可能是一系列汇编指令的一部分),因此会与程序本身一起存储。 - mjv
@mjv 嘿,我说它是一个好的参考,而不是答案;-) - Derek
7个回答

6
通常情况下,r值“存储”在程序本身中。换句话说,在程序运行之前,编译器本身计算10 + 5 - 3的值(因为它全部基于恒定的立即值),并发出汇编代码将此计算结果存储在分配的任何l值中(在这种情况下,变量名为a,编译器可能知道它是某种数据段起始位置的相对地址)。因此,r值的值为12仅在程序的二进制文件中找到,位于一个看起来像的汇编指令中。
  mov <some dest, typically DS-relative>, $0C 

$0C是“r-value”。

如果r-value恰好是在运行时进行的计算结果,例如底层c代码是:a = 17 * x; //x是一些运行时变量,则r-value也会作为程序二进制文件中的一系列指令“存储”(或者更确切地说是实现)。与上面简单的“mov dest,imm”的区别在于,加载变量x到累加器中,乘以17,并将结果存储在变量a所在的地址需要多个指令。编译器可能会授权自己使用堆栈来保存某些中间结果等,但这完全取决于编译器,而且通常只涉及r-value的一部分。因此,可以说r-value是一个编译时的概念,封装在程序的某些部分中(而不是数据),并且没有存储在任何地方,除了程序二进制文件。

针对paxdiablo的回应:上述解释确实限制了可能性,因为C标准实际上并没有规定任何这样的东西。即使如此,几乎所有的r-value最终都会通过设置一些指令部分地实现,以便正确地寻址适当的值,无论是计算得出的(在运行时)还是立即获得的。


我认为他在问代码的不同部分在堆栈中的位置。 - Derek
1
C标准中没有规定这种行为。你应该说:“通常,r-value是...”。 - paxdiablo
@paxdiablo。同意并编辑为“通常,”,我还在底部添加了一个小段落,你同意吗? - mjv

5

常量在编译时可能会被简化,因此您所提出的问题可能无法帮助。但是,像 i - j + k 这样需要从一些变量在运行时计算的表达式,可能会被编译器存储在 CPU 架构允许的任何位置:编译器通常会尽力使用寄存器。

 LOAD AX, i
 SUB AX, j
 ADD AX, k

在计算这样的表达式时,可以将其“存储”在累加器寄存器AX中,然后再使用STORE AX, dest或类似语句将其赋值给某个内存位置。如果现代优化编译器在一个相当简单的表达式上需要将寄存器溢出到内存中,即使是在一个半好的CPU架构(是的,包括x86!-),我会非常惊讶!


我删除了我的回答,所以你可能需要去掉“GMan说”。 :) - GManNickG

1
  • RHS(右手边)的计算结果是由编译器在所谓的“常量传播”步骤中计算的。
  • 然后,它被存储为装载值到 a 的汇编指令的操作数。

这里是 MSVC 的反汇编代码:

  int a;
  a = 10 + 5 - 3;

0041338E  mov         dword ptr [a],0Ch 

1

它存储的位置实际上完全取决于编译器。标准没有规定这种行为。

一个典型的位置可以通过实际编译代码并查看汇编输出来看到:

int main (int argc, char *argv[]) {
    int a;
    a = 10 + 5 - 3;
    return 0;
}

生成结果如下:

        .file   "qq.c"
        .def    ___main;
            .scl    2;
            .type   32;
        .endef
        .text
.globl _main
        .def    _main;
            .scl    2;
            .type   32;
        .endef
_main:
        pushl   %ebp
        movl    %esp, %ebp
        subl    $8, %esp
        andl    $-16, %esp
        movl    $0, %eax
        addl    $15, %eax
        addl    $15, %eax
        shrl    $4, %eax
        sall    $4, %eax
        movl    %eax, -8(%ebp)
        movl    -8(%ebp), %eax
        call    __alloca
        call    ___main
        movl    $12, -4(%ebp)         ;*****
        movl    $0, %eax
        leave
        ret

相关部分标记为;*****,您可以看到该值是由编译器创建并直接插入到mov类型指令中的。

请注意,之所以这么简单,是因为表达式是一个常量值。一旦引入非常量值(如变量),代码就会变得更加复杂。这是因为您必须在内存中查找这些变量(或它们可能已经在寄存器中),然后在运行时而不是编译时操作这些值。

至于编译器如何计算值应该是什么,那就涉及到表达式求值,这是另一个问题:-)


好的例子。我原本想说“看生成的汇编代码”,但我懒得创建一个例子。 :) 另外需要注意的是,如果常量值更大,它可能会变得更加复杂。有些处理器对可以直接放入指令中的值的大小有限制(例如8位或16位)。 - Steve Fallows

1

这取决于编译器。通常值(12)将由编译器计算。然后将其存储在代码中,通常作为加载/移动立即汇编指令的一部分。


那么你的意思是(10+5-3)在编译时计算?我想知道编译器是如何计算这个的? - user188276
这是一个很好的答案。在这个答案中,隐含着表达式“10+5-3”被暂时存储在编译器的工作内存中,可能以“表达式树”数据结构的形式。然后编译器优化(在这种情况下,常量传播)将解决具有常量值的表达式树。编译器将得出“12”,并且该12将成为程序汇编语言指令的操作数之一。 - Heath Hunnicutt
编译优化器方面的好书是《Muchnik, Advanced Compiler Design & Implementation》。 - Heath Hunnicutt

0

你的问题基于错误的前提。

C 语言中,左值(lvalue)的定义特性是它具有存储位置,即被储存。这是左值(lvalue)与右值(rvalue)的区别所在。右值(rvalue)并没有被储存的地方。这就是它成为右值(rvalue)的原因。如果它被储存了,那么根据定义,它就是左值(lvalue)。


它必须被存储在某个地方,否则你就无法使用它 :-) - paxdiablo
1
不,它并不需要。例如,当您使用0初始化变量时,机器代码可能只是将一个寄存器与自身进行xor操作。在这种情况下,“0”是否“存储在某处”?不需要。可以通过先前清零的寄存器的增量生成“1”。等等。R值不必存储在任何地方。这就是使它们成为r值的原因。 - AnT stands with Russia

0
术语“lvalue”和“rvalue”用于将表达式的世界分成两部分。也就是说,(10+5-3)是一个表达式,恰好是一个rvalue(因为您无法对其应用&运算符--在C++中规则更加复杂)。在运行时,没有表达式、lvalue或rvalue。特别地,它们不会被存储在任何地方。
您可能想知道值12存储在哪里,但值12既不是lvalue也不是rvalue(与表达式12相反,后者将是一个rvalue,但12不出现在您的程序中)。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接