32位机器中0x08048000之前的内存用于什么?

25

在Linux中,我了解到每个进程在32位机器上从0x08048000(64位机器上为0x00400000)开始存储数据。

但我不知道为什么要从那里开始。那么在0x08048000之前的内存是用来做什么的呢?

更新: 有些人认为这些内存被映射给内核使用。然而据我所知,Linux内核使用从用户栈开始的高端内存。

4个回答

15
答案是:很多东西。可执行文件的加载地址并没有神奇的意义,几乎任何东西都可以映射到较低的地址。常见的例子包括:C库(如C库)、动态装载器ld.so和内核VDSO(在x86 Linux中提供与内核一些接口的内核映射动态代码库)。但您实际上可以使用mmap()系统调用将任何希望映射到该位置的内容映射到那里。
例如,在我的机器上,映射如下(通过“cat /proc/self/maps”获得):
gby@watson:~$ cat /proc/self/maps 
001c0000-00317000 r-xp 00000000 08:01 245836     /lib/libc-2.12.1.so
00317000-00318000 ---p 00157000 08:01 245836     /lib/libc-2.12.1.so
00318000-0031a000 r--p 00157000 08:01 245836     /lib/libc-2.12.1.so
0031a000-0031b000 rw-p 00159000 08:01 245836     /lib/libc-2.12.1.so
0031b000-0031e000 rw-p 00000000 00:00 0 
00376000-00377000 r-xp 00000000 00:00 0          [vdso]
00852000-0086e000 r-xp 00000000 08:01 245783     /lib/ld-2.12.1.so
0086e000-0086f000 r--p 0001b000 08:01 245783     /lib/ld-2.12.1.so
0086f000-00870000 rw-p 0001c000 08:01 245783     /lib/ld-2.12.1.so
08048000-08051000 r-xp 00000000 08:01 2244617    /bin/cat
08051000-08052000 r--p 00008000 08:01 2244617    /bin/cat
08052000-08053000 rw-p 00009000 08:01 2244617    /bin/cat
09ab5000-09ad6000 rw-p 00000000 00:00 0          [heap]
b7502000-b7702000 r--p 00000000 08:01 4456455    /usr/lib/locale/locale-archive
b7702000-b7703000 rw-p 00000000 00:00 0 
b771b000-b771c000 r--p 002a1000 08:01 4456455    /usr/lib/locale/locale-archive
b771c000-b771e000 rw-p 00000000 00:00 0 
bfbd9000-bfbfa000 rw-p 00000000 00:00 0          [stack]

1
一些发行版(例如RHEL6)甚至通过使用“DYNAMIC”标志将程序链接起来,完全放弃了0x08048000的东西,使它们的段与.so一起分配。 - ivan_pozdeev

11

加载可执行代码的起始地址由可执行文件的ELF头部确定。例如:

/bin/ls
architecture: i386, flags 0x00000112:
EXEC_P, HAS_SYMS, D_PAGED
start address 0x08049bb0

没有什么能够阻止可执行文件指定不同的加载地址;由于默认链接器设置将其放在那里,你可以使用自定义链接脚本来覆盖它。

默认情况下,在linux/x86上,你不会发现低地址下方0x08000000被广泛使用,尽管内核可能会在mmap调用中请求使用它,或者如果空间不足时。此外,已经有提议在0x00000000 - 0x01000000范围内使用地址进行库映射,以使缓冲区溢出更加困难(通过嵌入NUL字节终止字符串)。


1
所有进程都有单独的虚拟地址转换表。因此,它们中的许多可以具有相同的起始地址,转换为不同的物理地址。 - Zxcv Mnb

2

加载地址是任意的,但在x86上与SYSV标准化了。对于每个架构来说都是不同的。上下方的内容也是任意的,并且通常被链接的库和mmap()区域占据。


1
典型的32位x86小型静态应用程序的负载图如下:
 Address     Contents

 0x08048000  code
 0x08052000  data
 0x0805A000  bss (zero data)
 0x08072000  end of data (brk marker)
 0xBFFFE000  stack

所有这些都是反向的 - 栈位于顶部,向下移动,而数据向上移动。我猜想,在0x08048000之前的地址静态链接了类似于每个操作系统的MBR。


如果您的程序映像加载在0x0848000处,那么您将看不到该位置以下的任何内容 - 没有“MBR”或其他任何东西。 - bdonlan

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接