前言
前一阵进行了iOS的技术分享,将以前整理的很多技术文章和理解的东西进行了下梳理,输出一个iOS反编译过程的思考及简单实践整理。
要点
0. 概念
1. LLVM说明与作用
2. Mach-o文件结构
3. 反编译Mach-o文件
概念
编译与反编译是互逆的过程,编译是将人类可以理解的程序语言向机器可以理解的机器语言转换的过程,有的人说这是一个信息加工的过程,是一个信息不断丢失的过程,这是由编译器的编译规则决定的。反编译就是对机器可以理解的机器码(可执行程序)向人类可以理解的编程语言转换的过程,也是一个信息找回,信息填充的过程,这个信息找回与信息填充不能和编译前的信息对等,只能是接近或相似。
LLVM
LLVM项目是一系列分模块、可重用的编译工具链。它提供了一种代码编写良好的中间表示(IR),可以作为多种语言的后端,还可以提供与编程语言无关的优化和针对多种cpu的代码生成功能。
- 前端:用来获取源代码,将之转变为某种中间表示,提供不同的编译器作为LLVM的前端,GCC,Clang。
- Pass:用来将程序的中间表示之间相互变换。
- 后端:后端用来生成实际的机器码。
从源码到可执行的机器码
- 预处理:宏替换与展开,导入头文件等,代码的转换
- 词法分析:将预处理的代码转换成一个个token
- 语法分析:验证语法正确性,最后将所有节点组合成抽象语法树(AST)
- IR代码生成:负责将语法树从顶至下遍历,翻译成LLVM IR,LLVM IR是前端的输出,也是LLVM Backerend的输入,桥接前后端。这里可以做系统的转化和优化,可以加入用户自己的转化和优化程序。
- 生成字节码:我们在Xcode7中默认生成bitcode就是这种的中间形式存在, 开启了bitcode,那么苹果后台拿到的就是这种中间代码,苹果可以对bitcode做一个进一步的优化,如果有新的后端架构,仍然可以用这份bitcode去生成
- 生成相关汇编
- 生成目标文件
- 生成可执行文件
由于源地址找不到,找到伯乐在线的文章
参考:
Mach-o 文件结构
Mach-o文件是OS X和iOS中可执行文件格式。PE文件是Windows系统的可执行文件格式。
Mach-o包含三个基本区域:
- Header 头部
- Load Commands 加载命令
- Row segment data 段
参考:
https://opensource.apple.com/source/xnu/xnu-1456.1.26/EXTERNAL_HEADERS/mach-o/loader.h
使用MachOview 查看Mach-o文件格式
参考:
http://blog.csdn.net/zhangmiaoping23/article/details/50172075
使用class-dump反编译Mach-o头文件
class-dump
利用class-dump 生成Mach-o文件的头文件
命令如下:class-dump -H MachODemo.app
结果如下:
Hopper Disassembler v3
利用Hopper工具进行反编译
选中方法,点击右上角的if(b) f(x) 可以看到对应反编译出的伪代码。
这里已经可以看到源代码中的代码意图,需要花费时间对伪代码进行重新实现和整理。
或者修改现有程序中的跳转逻辑,达到让app执行一些其他测试,窃取数据等的目的。
参考: