如何在 iOS 上 hook 一个 C 函数

在 iOS 上，Objective-C runtime 提供了一系列函数，可以很容易地 hook Objective-C 的方法。因为 Objective-C 的动态性很高，每个 Objective-C 的方法(SEL)都是对应一个匿名 C 函数的实现(IMP)，只要去修改这个 Objective-C 方法与 C 实现的映射关系，就可以很容易地做到 hook 的功能。但是对于 C 函数本身，就不是那么简单的事情了。

Mach-O 的映像结构

要想了解如何 hook C 函数，需要先了解下 iOS 下 Mach-O 可执行文件载入的过程。一个 iOS app 进程可以包含多个映像(image)，可执行文件自己的代码是一个 image，它所链接的每个动态库也各分配了一个 image。每个映像分为三个区域，mach header, load commands 和 data，图示如下（以下说明都以 64 位架构为准，32 位也是差不多的）：

Mach-O 的映像结构

(图片来自seriot.ch - Hello Mach-O)

Mach header 用来记录映像的元信息，比如 CPU 架构等，具体细节我们不关心。load commands 区域是由若干个长度不等的 load command 排在一起，每个 load command 用来告诉加载器进行一些加载工作，其中最主要的 load command 类型是 segment command，目前我们只关心这一种命令，该命令让加载器在把指定的数据（由文件偏移量fileoff和大小filesize决定）加载到指定的地址里，地址为 vmaddr+slide，slide 后文再说。知道了地址，就能对指定段和节的数据进行操作了。

struct segment_command_64 { /* for 64-bit architectures */
    uint32_t    cmd;        /* LC_SEGMENT_64 */
    uint32_t    cmdsize;    /* includes sizeof section_64 structs */
    char        segname[16];    /* segment name */
    uint64_t    vmaddr;     /* memory address of this segment */
    uint64_t    vmsize;     /* memory size of this segment */
    uint64_t    fileoff;    /* file offset of this segment */
    uint64_t    filesize;   /* amount to map from the file */
    vm_prot_t   maxprot;    /* maximum VM protection */
    vm_prot_t   initprot;   /* initial VM protection */
    uint32_t    nsects;     /* number of sections in segment */
    uint32_t    flags;      /* flags */
};

一个 segment 可以有0或多个 section，从 nsects里可以获得，这些 section 就是紧接着 segment 后面指定。load commands 后面就是实际的数据了。

遍历方法

由于这三个部分是紧密地排在一起的，因此只要知道映像的首址和每个部分的大小，就可以通过指针算数获取每个区块的内容。比如我们通过 _dyld_get_image_header 可以获得映像的 header 的地址，然后加上一个偏移量sizeof(struct mach_header_64)，就是 load commands 区域的首址，header 中会有一个名为ncmds的字段记录该区域有几条 load command，每个 load command 最前面必定是有两个字段：

struct load_command {
    uint32_t cmd;       /* type of load command */
    uint32_t cmdsize;   /* total size of command in bytes */
};

cmd 用来表示 load command 的类型，cmdsize 表示该命令所占的空间大小，这样结合前面 header 提供的命令数和计算出来的 load commands 区域的首址，就可以遍历该区域的所有 load command 了。

ASLR

ASLR 是 Address Space Layout Randomization 的缩写，这个概念在业界由来已久，并非苹果原创。由于 vmaddr 是链接器链接的时候写入 Mach-O 文件的，对于一个进程来说是静态不变的，因此给黑客攻击带来了便利，iOS 4.3 以后引入了 ASLR，给每个 image 在 vmaddr 的基础上再加一个随机的偏移量 slide，因此每段数据的真实的虚拟地址是 vmaddr + slide。

开始 hook

两个函数表

在__DATA 段有两个特殊的节：__nl_symbol_ptr和__la_symbol_ptr，这两个节都是一个函数数组，前者存储非懒加载解析的 C 函数地址，后者存储懒加载存储的函数地址。

对于以非懒加载的动态库，加载动态库映像的时候，将所有的符号全部解析出来填入该表，而对于懒加载的动态库，则默认用一个特殊的函数 dyld_stub_helper填充之，懒加载的函数第一次调用的时候，从映像中解析出地址，然后填充调用之。因此只要我们修改这两个表的内容，就可以替换原先函数的实现了。但问题是，这两个节存储的都是函数地址，没有函数名，那么我们怎样通过函数名找到对应的函数地址呢？

__LINKEDIT 段

Mach-O 文件里另有一个特殊的段，这个段存储了很多符号信息，与我们 hook C 函数有关的有三个数组：

间接符号表
符号表
字符串表
间接符号表记录了前面函数表里的函数所对应的符号表下标，比如说某个函数表里分别表示的是 A, B, C, D 四个函数的地址，而对应的符号表里四个函数的顺序为 B, D, C, A，那么这个函数表所对应的间接符号表的元素就是 3, 0, 2, 1。我们通过间接符号表就从函数地址查到函数在符号表的索引，然后通过这个索引再查符号表，符号表的每个表项是 struct nlist_64

struct nlist_64 {
    union {
        uint32_t  n_strx; /* index into the string table */
    } n_un;
    uint8_t n_type;        /* type flag, see below */
    uint8_t n_sect;        /* section number or NO_SECT */
    uint16_t n_desc;       /* see <mach-o/stab.h> */
    uint64_t n_value;      /* value of this symbol (or stab offset) */
};

这个结构体的 n_un.n_strx 就是该函数的名字在字符串表中的索引，通过这个索引查字符串表就能得到函数名字。流程总结一下：

从间接地址表得到符号表索引
通过符号表和符号表索引得到函数对应的符号表表项
通过符号表表项得到函数名在字符串表的索引
通过字符串表和字符串表索引找到函数名
然后比较函数名是否是要 hook 的函数，是的话，就用新的函数替换原先的表项，当然在替换之前最好把原先的地址拿出来，供新函数使用。

Facebook 的开源库 fishhook

以上的流程实际上编码起来是很繁琐的，好在 Facebook 已经帮我们做好了一个库：fishhook，这个库进行 hook 的原理就是上面所说的这些，Facebook 自己的循环引用检测库 FBRetainCycleDetector 就基于 fishhook 实现的。

最后编辑于：2017.12.10 02:30:58

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,456评论 5赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,370评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,337评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,583评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,596评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,572评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,936评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,595评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,850评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,601评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,685评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,371评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,951评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,934评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,167评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 43,636评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,411评论 2赞 342

如何在 iOS 上 hook 一个 C 函数

Mach-O 的映像结构

遍历方法

ASLR

开始 hook

两个函数表

__LINKEDIT 段

Facebook 的开源库 fishhook

推荐阅读更多精彩内容