对于一个普通的hello.c程序:
#include
int main ()
{
printf("hello,world");
}
在计算机操作系统层面的执行过程是这样的。
hello程序的生命周期是从人能读懂的高级语言C程序开始,然后C语句被其他程序转化为一系列的低级机器语言指令,这些指令再按照可执行目标程序的格式打包好,并以二进制磁盘文件的形式存放起来。(目标程序也成为可执行目标文件)。
在Unix系统上,从源文件到目标文件的转化是由编译器驱动程序完成的:
unix> gcc -o hello hello.c
GCC编译器驱动程序读取源程序文件hello.c,并把它翻译成一个可执行目标文件。这个翻译过程可分为四个阶段完成(预处理器 -> 编译器 -> 汇编器 -> 链接器)一起构成了编译系统:
1、预处理阶段。预处理器(cpp)根据以字符#开头的命令,修改原始C程序。比如 #include命令告诉预处理器读取系统文件stdio.h的内容,并把它插入到程序文本中。结果就得到了另一个C程序,通常是以.i作为文件扩展名。
2、编译阶段。 编译器(ccl)将文本文件hello.i翻译成文本文件hello.s,它包含一个汇编语言程序。(汇编语言程序中的每条语句都以一种标准的文本格式确切地描述了一条低级机器语言指令。并且,汇编语言为不同高级语言的不同编译器提供了通用的输出语言。)
3、汇编阶段。汇编器(as)将hello.s翻译成机器语言指令,把这些指令打包成一种叫做可重定位目标程序的格式,并将结果保存在目标文件hello.o中。hello.o是一个二进制文件,它的字节编码是机器语言指令而不是字符。用文本编辑器打开.o文件,看到的是一堆乱码。
4、链接阶段。请注意,hello程序调用了一个printf函数,这是每个C编译器都会踢动的标准C库中的一个函数。printf函数存在于一个名为printf.o的单独编译好了的目标文件中,而这个文件必须以某种方式合并到我们的hello.o程序中。链接器(ld)就负责处理这种合并。结果就得到一个可执行目标文件(或者简称可执行文件),可以被加载到内存中由操作系统执行。
编译系统到此结束,此时的hello.c源程序文件已经被编译系统翻译成了可执行目标文件hello.o,并存放在磁盘上。要想在Unix系统上运行该可执行文件,我们将它的文件名输入到成为外壳(shell)的应用程序中:
unix> ./hello
hello,world
unix>
外壳是一个命令行解释器,等待你输入一个命令行,然后执行这个命令。若该命令行的第一个单词不是一个内置的外壳命令,那么外壳就会假设这是一个可执行文件的名字,外壳程序将加载并运行这个文件。次例中,外壳将加载并运行hello程序,然后等待程序终止。hello程序在屏幕上输出它的信息,然后终止。外壳随后输出一个提示符,等待下一个输入的命令行。
运行hello程序
外壳程序shell命令输入字符串“./hello”后,外壳程序将字符逐一读入寄存器,再把它存放到存储器中。
完成命令行,敲击回车之后,外壳知道我们结束了命令的输入,开始执行一系列指令来加载可执行的hello.o文件,将目标文件中的代码和数据从磁盘复制到主存。数据包括最终会被输出的字符串“hello,world\n”.(利用直接存储器存取的技术,数据可以不通过处理器而直接从磁盘到达主存)。
一旦目标文件hello中的代码和数据被加载到主存,处理器就开始执行hello程序的main程序中的机器语言指令。这些指令将“hello,world\n”字符串中的字节从主存复制到寄存器文件,再从寄存器文件中复制到显示设备,最终显示在屏幕上。
操作系统坑刚开,先写这么多。。。。