程序在内存中的结构
下面是当程序被加载到内存中时的基本结构。
+--------------------------+
| |
| command line |
| arguments |
| (argc and argv[]) |
| |
+--------------------------+
| Stack |
| (grows-downwards) |
| |
| |
| |
| F R E E |
| S P A C E |
| |
| |
| |
| |
| (grows upwards) Heap |
+--------------------------+
| |
| Initialized data |
| segment |
| |
+--------------------------+
| |
| Initialized to |
| Zero (BSS) |
| |
+--------------------------+
| |
| Program Code |
| |
+--------------------------+
需要注意以下几点:
- 数据段
- 已初始化数据段(由程序员显式初始化)
- 未初始化数据段(初始化为零数据段——BSS [带符号块开始])
- 代码段
- 堆栈区域和堆区域
数据段
数据段包含全局和静态数据,这些数据由用户明确初始化并包含有初始化值。
数据段的另一部分称为BSS(��为旧的IBM系统将该段初始化为零)。这是操作系统初始化内存块为零的内存部分。这就是未初始化的全局数据和静态变量的默认值为零的原理。此区域是固定的,大小静态。
数据区根据显式初始化分为两个区域,因为要初始化的变量可以逐个初始化。但是,不需要显式初始化未初始化的变量。相反,将变量的初始化工作留给操作系统。这种批量初始化可以大大缩短加载可执行文件所需的时间。
大多数情况下,数据段的布局由底层操作系统控制,但某些加载器会给用户部分控制权。在嵌入式系统等应用中,这些信息可能很有用。
可以使用指针从代码中访问和访问此区域。自动变量在每次需要时都要初始化变量,因此代码需要进行初始化。但是,数据区域中的变量没有这种运行时负担,因为初始化仅在加载时完成一次。
代码段
程序代码是可执行代码可用于执行的代码区域。该区域的大小也是固定的。只能通过函数指针访问此区域,而不能通过其他数据指针访问此区域。还有一个重要信息需要注意,即系统可能将此区域视为只读内存区域,任何尝试写入此区域的操作都会导致未定义的行为。
常量字符串可以放置在代码区域或数据区域,具体取决于实现方式。
尝试写入代码区域会导致未定义的行为。例如(我只会给出基于C
的示例),以下代码可能导致运行时错误甚至崩溃系统。
int main()
{
static int i;
strcpy((char *)main,"something");
printf("%s",main);
if(i++==0)
main();
}
堆和栈区
在执行过程中,程序使用两个主要部分:栈和堆。栈用于函数的堆栈帧,堆用于动态内存分配。栈和堆是未初始化的区域。因此,无论内存中存在什么内容都将成为在该空间创建的对象的初始(垃圾)值。
让我们看一个样例程序,展示哪些变量存储在哪里:
int initToZero1;
static float initToZero2;
FILE * initToZero3;
double intitialized1 = 20.0;
int main()
{
size_t (*fp)(const char *) = strlen;
char *dynamic = (char *)malloc(100);
int stringLength;
static int initToZero4;
static int initialized2 = 10;
strcpy(dynamic,”something”);
stringLength = fp(dynamic);
}
或者考虑一个更为复杂的例子,
int main(int numOfArgs, char *arguments[])
{
static int i;
int (*fp)(int,char **) = main;
static char *str[] = {"thisFileName","arg1", "arg2",0};
while(*arguments)
printf("\n %s",*arguments++);
if(!i++)
fp(3,str);
}
希望这可以帮到你!