Linux[链接]: 静态链接,动态链接及linux内存布局
一. 目标文件
1.1 目标文件概述
现在PC平台流行的可执行文件格式,主要是Windows下的PE(Portable Executable)和Linux的ELF(Executable Linkable Format),它们都是COFF(Common file format)格式的变种。
目标文件就是源代码编译后但未进行链接的那些中间文件(Windows的.obj和Linux的.o),它跟可执行文件的内容与结构很相似,所以一般跟可执行文件格式采用一种格式存储。
动态链接库(Windows的.dll和Linux的.so)及静态链接库(Windows的.lib和Linux的.a)文件都按照可执行文件格式存储
目标文件中包含编译后生成的机器指令代码,数据,还有包括链接需要的信息,如符号表,调试信息,字符串.
1.2 目标文件中的重点Section:
(1)代码段(.text)
程序源代码编译后的机器指令
(2)数据段(.data)
已初始化了的全局变量和局部静态变量数据
(3).bss段(.bss)
未初始化的全局变量和局部静态变量,
未初始化的全局变量和局部静态变量默认值都为0,本来也可以被放在.data段,但是在目标文件中为它们分配空间是没有必要的。因此,统一放到.bss段,.bss段大小为0,不出现在目标文件中。
(4).rodata段存放的是只读数据,一般是程序里面的只读变量和字符串常量。
ps:
bss段不占据磁盘空间的理解:https://blog.csdn.net/move_now/article/details/69307890
关于BSS段的大小:https://blog.csdn.net/fivedoumi/article/details/53085440
从编写源代码到程序在内存中运行的全过程解析 :https://blog.csdn.net/kang___xi/article/details/79571137
二.静态链接: 将.o目标文件链接成可执行文件
2.1 静态链接的原理
静态库可以简单的看成一组目标文件的集合
静态链接如果program A和 program B都使用到c.o,需要各自链接c.o至各自的可执行文件中,
2.2 静态链接的特点
缺点:比较浪费空间,另外更新困难.
优点: 编译时链接,启动性能相对较好.
三.动态链接: 运行时加载动态so库至程序映像中
3.1 原理
动态链接基本思想把程序按照模块拆分成各个相对独立部分,在程序运行时才将它们链接在一起形成一个完整的程序.
3.2 举个例子:
假设现在有两个程序program1.o和program2.o,这两者共用同一个库lib.o,假设首先运行程序program1,系统首先加载program1.o,当系统发现program1.o中用到了lib.o,即program1.o依赖于lib.o,那么系统接着加载lib.o,如果program1.o和lib.o还依赖于其他目标文件,则依次全部加载到内存中。当program2运行时,同样的加载program2.o,然后发现program2.o依赖于lib.o,但是此时lib.o已经存在于内存中,这个时候就不再进行重新加载,而是将内存中已经存在的lib.o映射到program2的虚拟地址空间中,从而进行链接(这个链接过程和静态链接类似)形成可执行程序。
3.3 特点:
优点: 节省空间,更新方便
缺点: 运行时准确来说是装载时链接,影响启动性能
3.4 了解 PLT/GOT:
深入了解GOT,PLT和动态链接:https://www.cnblogs.com/pannengzhi/p/2018-04-09-about-got-plt.html
延迟链接意味着动态链接器不会在程序加载时解析每一个函数,而是在调用时通过.plt 和.got.plt 节(分别对应各自的过程链接表和全局偏移表)来对函数进行解析。
红色为第一次函数调用的顺序,蓝色为后续函数调用的顺序(第1步都要执行)
GOT在数据段,PLT在代码段
重要的概念: 地址无关,PIC
四. Linux进程内存布局
Anatomy of a Program in Memory : https://manybutfinite.com/post/anatomy-of-a-program-in-memory/
- 栈: 存放局部变量、函数参数,用于维护函数调用上下文,离开栈函数调用就没法实现.经典操作系统栈通常在用户空间的最高地址处分配,栈向低地址增长.
- 堆: 用于容纳应用程序动态分配的内存区域,如malloc或new分配的内存来自于堆.经典操作系统堆通常存在与栈的下方(低地址方向),堆向高地址增长.
- 可执行文件映像:
- .bss段: 未初始化全局变量,未初始化全局静态变量
- .data 数据段: 已初始化全局变量、已初始化全局静态变量、局部静态变量、常量数据
- .text 代码段: 可执行代码、字符串常量
- 保留区:在内存中多处受到保护而禁止访问的内存区域总称.
一些问题:
1.内存的分配方式有几种?
【参考答案】
一、从静态存储区域分配。内存在程序编译的时候就已经分配好,这块内存在程序的整个运行期间都存在。例如全局变量。
二、在栈上创建。在执行函数时,函数内局部变量的存储单元都可以在栈上创建,函数执行结束时这些存储单元自动被释放。栈内存分配运算内置于处理器的指令集中,效率很高,但是分配的内存容量有限。
三、从堆上分配,亦称动态内存分配。程序在运行的时候用malloc或new申请任意多少的内存,程序员自己负责在何时用free或delete释放内存。动态内存的生存期由我们决定,使用非常灵活,但问题也最多。