main()函数是如何被调用的?在__libc_start_main()中对main()进行了调用。

3

我正在尝试理解在 __libc_start_main() 中调用 main() 的过程。我知道 __libc_start_main() 的一个参数是 main() 的地址。但是,由于没有 CALLJMP 指令,我无法弄清楚在 __libc_start_main() 中如何调用 main()。在执行跳转到 main() 之前,我看到以下反汇编代码。

   0x7ffff7ded08b <__libc_start_main+203>:  lea    rax,[rsp+0x20]
   0x7ffff7ded090 <__libc_start_main+208>:  mov    QWORD PTR fs:0x300,rax
=> 0x7ffff7ded099 <__libc_start_main+217>:  mov    rax,QWORD PTR [rip+0x1c3e10]        # 0x7ffff7fb0eb0

我用C语言写了一个简单的"Hello, World!!"程序。在下面的汇编代码中:

  1. 在地址0x7ffff7ded099处执行指令后,程序跳转到main()函数中。
  2. 为什么MOV (to RAX)指令会导致跳转到main()函数?
1个回答

5

当然,那些指令并不是导致调用 main 的指令。我不确定您是如何按步骤执行这些指令的,但如果您使用的是 GDB,则应该使用 stepi 而不是 nexti

我不知道为什么会发生这种情况(某些奇怪的 GDB 或 x86 怪癖?),因此我只是根据个人经验说话,但在反汇编 ELF 二进制文件时,我偶尔发现 nexti 命令在中断之前会执行多个指令。在你的情况下,在实际调用 main()call rax 之前会错过一些 mov

您可以采取的措施是使用 stepi,或者转储更多代码,然后明确告诉 GDB 设置断点:

(gdb) x/20i
    0x7ffff7ded08b <__libc_start_main+203>: lea    rax,[rsp+0x20]
    0x7ffff7ded090 <__libc_start_main+208>: mov    QWORD PTR fs:0x300,rax
 => 0x7ffff7ded099 <__libc_start_main+217>: mov    rax,QWORD PTR [rip+0x1c3e10]        # 0x7ffff7fb0eb0
    ... more lines ...
    ... find call rax ...
(gdb) b *0x7ffff7dedXXX <= replace this
(gdb) continue

这里是我系统上__libc_start_main()调用main()的过程:
21b6f:  48 8d 44 24 20          lea    rax,[rsp+0x20]               ; start preparing args
21b74:  64 48 89 04 25 00 03    mov    QWORD PTR fs:0x300,rax
21b7b:  00 00
21b7d:  48 8b 05 24 93 3c 00    mov    rax,QWORD PTR [rip+0x3c9324] 
21b84:  48 8b 74 24 08          mov    rsi,QWORD PTR [rsp+0x8]
21b89:  8b 7c 24 14             mov    edi,DWORD PTR [rsp+0x14]
21b8d:  48 8b 10                mov    rdx,QWORD PTR [rax]
21b90:  48 8b 44 24 18          mov    rax,QWORD PTR [rsp+0x18]     ; get address of main
21b95:  ff d0                   call   rax                          ; actual call to main()
21b97:  89 c7                   mov    edi,eax
21b99:  e8 32 16 02 00          call   431d0 <exit@@GLIBC_2.2.5>    ; exit(result of main)

前三条指令与您展示的相同。在调用 rax 时,rax 将包含 main 的地址。调用 main 后,结果被移动到 edi(第一个参数),然后调用了 exit(result)
查看 glibc 的源代码 __libc_start_main() ,我们可以看到这正是发生的情况。
/* ... */

#ifdef HAVE_CLEANUP_JMP_BUF
  int not_first_call;
  not_first_call = setjmp ((struct __jmp_buf_tag *) unwind_buf.cancel_jmp_buf);
  if (__glibc_likely (! not_first_call))
    {
      /* ... a bunch of stuff ... */
      /* Run the program.  */
      result = main (argc, argv, __environ MAIN_AUXVEC_PARAM);
    }
  else
    {
      /* ... a bunch of stuff ... */
    }
#else
  /* Nothing fancy, just call the function.  */
  result = main (argc, argv, __environ MAIN_AUXVEC_PARAM);
#endif
  exit (result);
}

在我的情况下,从反汇编结果可以看出当我的glibc被编译时定义了HAVE_CLEANUP_JMP_BUF,因此实际调用main()的是在if语句内部的那一个。我也怀疑你的glibc也是这种情况。

有趣... 我不确定为什么在我的反汇编中看不到"CALL RAX"指令。 - Harry
1
@Harry 我已经添加了如何让GDB显示更多行的说明。 - Marco Bonelli
是的,我现在看到了“CALL RAX”,这回答了我的问题。使用“nexti”时,GDB跳过几条指令确实很奇怪... - Harry
我经常发现nexti命令在中断之前执行了几条指令。在x86_64上,这几乎是不可能的,我从未见过这种情况发生(而且我整天都在调试)。肯定是其他问题导致了这种情况。 - Employed Russian
@EmployedRussian 我真的不知道如何解释这种行为...我知道这是毫无意义的,但在我之前也发生过这种情况...虽然我可能不应该说“经常”,但这很少见。这可能是我正在使用的GDB插件的一个错误,我不知道。不过我很感兴趣,你为什么说在x86-64上这是不可能的?这是完全由硬件特性支持的吗? - Marco Bonelli

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接