不同于静态库,动态库是在程序启动之后做的重定位,重定位分为两种
- lazy bind: 主要用于模块外部的函数调用,由于调用者并不是每个函数都调用,延迟绑定有利于提高动态库的加载速度
- no lazy bind: 主要用于模块外部调用一些全局的变量,由于通常暴露的外部变量较少,所以在启动时绑定,但少数函数除外,例如dyld_stub_binder。
先看看no lazy bind ,首先要确定的是那些符号是需要no lazy bind 的.
DATA段中有一段叫做got(Global Offset Table), 也就 Non_lazy_symbol_table,主要不是看它的名字,而是因为它的flags = S_NON_LAZY_SYMBOL_POINTERS。
在看下got段的value
全部为0,也就是说在程序启动之前这个值是没有初始化的。
那么如何观察启动之后,这个地址了。
原理比较简单, 先记下静态环境下got 起始地址_got_static_addr, 记下_main函数的其实地址_main_static_addr,由于程序启动后虚拟内存会产生随机偏移,所以我们要修正这个偏移量才能找到_got的内存地址。程序启动后我们可以得到真实的main函数地址_main_launch_addr,那么通过计算就能求得_got_launch_addr。
_got_launch_addr = _got_static_addr + _main_launch_addr - _main_static_addr
下面是Demo
// framework
// .h
extern char *kawayiBoy;
// .c
#import "*.h"
char *kawayiBoy = "opx";
// main.c
#import <Framework/Framework.h>
int main(int argc, char * argv[]) {
NSLog(@"%s",kawayiBoy);
}
no_lazy_point 地址: 0x100003010
main 函数地址: 0x100001810
程序启动后的地址: 0x108e68810
那么最终 no_lazy_point 的地址为:
0x108e68810 - 0x100001810 + 0x100003010 = 0x108e6a010
查看一下 0x108e6a010 的内存: 0x010915e000 ,
在查看一下 0x010915e000 内存,还不是字符串,还是一个地址:0x10915dfcc
在跟踪一下 0x10915dfcc, 终于找到你了,我的字符串
现在我已经验证了no_lazy_bind在程序启动之后,以及设定了好了所有值了。访问模块外部数据变量的整个行为链是这样的
以上图为例的话
- 访问got: 0x108e6a010 ,
***str
- 访问got 指向的地址 : 0x010915e000 ,
**str
- 再访问内存所指向的地址: 0x10915dfcc,
*str
- 最后定位到字符串:
str
那么no lazy bind 这个段是由谁设置的了,dyld 动态链接库编辑器。与之相关的主要是 dy_segment_64(__LINKEDIT) , 这个段里存储了dyld需要的信息。
DC_LOAD_DYLINKER , dyld加载命令,有意思的是dyld本质上仍然是一个动态库,它只不过是有点特殊的动态库,别的动态库由它来加载,而它了就比较苦逼了,只能自己加载自己,这个过程就做自举