1. LinkMap解析
导读
IOS在做包大小优化的时候,需要分析包大小组成,然后通过包大小组成来有针对的做优化。其中最主要的工具就是linkmap文件的解析,下面文章讲简单说明如何解析linkmap文件。
1.1 如何生成linkMap文件
-
Xcode开启编译选项Write Link Map File
XCode -> Project -> Build Settings -> 搜map -> 把Write Link Map File选项设为yes,并指定好linkMap的存储位置
-
编译后,到编译目录里找到该txt文件,文件路径就是上面设定的路径,我的位于:
~/Library/Developer/Xcode/DerivedData/FFProject-gdxobffdqcwvyleustpwgfdxslqp/Build/Intermediates/FFProject.build/Debug-iphonesimulator/FFProject.build
1.2 linkMap文件结构解析
1.2.1. 基础信息
# Path: /Users/bolei/Library/Developer/Xcode/DerivedData/FFProject-gdxobffdqcwvyleustpwgfdxslqp/Build/Products/Debug-iphonesimulator/FFProject.app/FFProject //路径
# Arch: x86_64 //架构
1.2.2.类表
# Object files: //类文件
[ 0] linker synthesized
[ 1] dtrace
[ 2] /Users/bolei/Library/Developer/Xcode/DerivedData/FFProject-gdxobffdqcwvyleustpwgfdxslqp/Build/Intermediates/FFProject.build/Debug-iphonesimulator/FFProject.build/Objects-normal/x86_64/PAFFConfig.o
这里保存了所有用到的类生成的.o文件,也包括用到的dylib
库。前面[num]是序号,类是按照顺序保存的,后续可以通过序号查到具体对应的哪个类。
1.2.3.段表
# Sections:
# Address Size Segment Section
0x100002460 0x00E382DF __TEXT __text
0x100E3A740 0x000019D4 __TEXT __stubs
0x100E3C114 0x0000273E __TEXT __stub_helper
0x100E3E860 0x0009D78B __TEXT __cstring
0x100EDBFEB 0x00089F7A __TEXT __objc_methname
0x100F65F65 0x0000CFCD __TEXT __objc_classname
0x100F72F32 0x00012A27 __TEXT __objc_methtype
0x100F8595A 0x000122E8 __TEXT __ustring
0x100F97C44 0x00067DA8 __TEXT __gcc_except_tab
0x100FFF9F0 0x000259C8 __TEXT __const
0x1010253B8 0x0000017C __TEXT __entitlements
0x101025534 0x0000037B __TEXT __dof_RACSignal
0x1010258AF 0x000002E8 __TEXT __dof_RACCompou
0x101025B98 0x00016928 __TEXT __unwind_info
0x10103C4C0 0x00013B40 __TEXT __eh_frame
0x101050000 0x00000010 __DATA __nl_symbol_ptr
0x101050010 0x00000D30 __DATA __got
0x101050D40 0x00002270 __DATA __la_symbol_ptr
0x101052FB0 0x00000030 __DATA __mod_init_func
0x101052FE0 0x00036580 __DATA __const
0x101089560 0x0005EB20 __DATA __cfstring
0x1010E8080 0x000040A8 __DATA __objc_classlist
0x1010EC128 0x00000448 __DATA __objc_nlclslist
0x1010EC570 0x00000AA8 __DATA __objc_catlist
0x1010ED018 0x00000048 __DATA __objc_nlcatlist
0x1010ED060 0x00000780 __DATA __objc_protolist
0x1010ED7E0 0x00000008 __DATA __objc_imageinfo
0x1010ED7E8 0x001A2B80 __DATA __objc_const
0x101290368 0x00020CE8 __DATA __objc_selrefs
0x1012B1050 0x00000168 __DATA __objc_protorefs
0x1012B11B8 0x00003B80 __DATA __objc_classrefs
0x1012B4D38 0x00002620 __DATA __objc_superrefs
0x1012B7358 0x00010AF0 __DATA __objc_ivar
0x1012C7E48 0x000286E0 __DATA __objc_data
0x1012F0530 0x0000BB48 __DATA __data
0x1012FC080 0x00011A40 __DATA __bss
0x10130DAC0 0x00000538 __DATA __common
接下来是段表,描述了不同功能的数据保存的地址,通过这个地址就可以查到对应内存里存储的是什么数据。
其中第一列是起始地址,第二列是段占用的大小,第三个是段类型,第四列是段名称,每一行初始地址 = 上一行的初始地址+占用大小
其中:
__TEXT 表示代码段,用于执行,可读不可以写,可以被执行
__DATA 表示数据段,用于存储数据,可以读写,不可以执行
其中:
第一个段是__PAGEZERO 地址从0到0x100000000,程序保留字段。
1.2.3.1 段表内容含义
__TEXT段节名含义
1. __text: 代码节,存放机器编译后的代码
2. __stubs: 用于辅助做动态链接代码(dyld).
3. __stub_helper:用于辅助做动态链接(dyld).
4. __objc_methname:objc的方法名称
5. __cstring:代码运行中包含的字符串常量,比如代码中定义`#define kGeTuiPushAESKey @"DWE2#@e2!"`,那DWE2#@e2!会存在这个区里。
6. __objc_classname:objc类名
7. __objc_methtype:objc方法类型
8. __ustring:
9. __gcc_except_tab:
10. __const:存储const修饰的常量
11. __dof_RACSignal:
12. __dof_RACCompou:
13. __unwind_info:
__DATA段节名含义
1. __got:存储引用符号的实际地址,类似于动态符号表
2. __la_symbol_ptr:lazy symbol pointers。懒加载的函数指针地址。和__stubs和stub_helper配合使用。具体原理暂留。
3. __mod_init_func:模块初始化的方法。
4. __const:存储constant常量的数据。比如使用extern导出的const修饰的常量。
5. __cfstring:使用Core Foundation字符串
6. __objc_classlist:objc类列表,保存类信息,映射了__objc_data的地址
7. __objc_nlclslist:Objective-C 的 +load 函数列表,通常比 __mod_init_func 更早执行。具体可以
8. __objc_catlist: categories
9. __objc_nlcatlist:Objective-C 的categories的 +load函数列表。
10. __objc_protolist:objc协议列表
11. __objc_imageinfo:objc镜像信息
12. __objc_const:objc常量。保存objc_classdata结构体数据。用于映射类相关数据的地址,比如类名,方法名等。
13. __objc_selrefs:引用到的objc方法
14. __objc_protorefs:引用到的objc协议
15. __objc_classrefs:引用到的objc类
16. __objc_superrefs:objc超类引用
17. __objc_ivar:objc ivar指针,存储属性。
18. __objc_data:objc的数据。用于保存类需要的数据。最主要的内容是映射__objc_const地址,用于找到类的相关数据。
19. __data:暂时没理解,从日志看存放了协议和一些固定了地址(已经初始化)的静态量。
20. __bss:存储未初始化的静态量。比如:`static NSThread *_networkRequestThread = nil;`其中这里面的size表示应用运行占用的内存,不是实际的占用空间。所以计算大小的时候应该去掉这部分数据。
21. __common:存储导出的全局的数据。类似于static,但是没有用static修饰。比如KSCrash里面`NSDictionary* g_registerOrders;`, g_registerOrders就存储在__common里面
1.2.4 后续符号表内容
1.2.4.1 代码节
# Symbols:
# Address Size File Name
0x100002460 0x00000080 [ 2] +[PAFFConfig instance]
0x1000024E0 0x00000050 [ 2] ___22+[PAFFConfig instance]_block_invoke
0x100002530 0x00000090 [ 2] -[PAFFConfig init]
apiType]
这里面保存里类里面的方法内存情况。其中
- 第一列是起始地址位置,通过这个地址我们可以查上面的段表,可以知道,对应的节为
__text
。 - 第二列是大小,通过这个可以算出方法占用的大小。
- 第三列是归属的类(.o文件),这里序号是2,通过查类表可以知道对应的类是PAFFConfig。
通过这部分我们可以分析出来每个类对应的方法的大小是多少。
1.2.4.2 方法名节(__objc_methname
)
0x100EDBFEB 0x00000006 [ 2] literal string: alloc
0x100EDBFF1 0x00000005 [ 2] literal string: init
0x100EDBFF6 0x0000000B [ 2] literal string: mainBundle
0x100EDC001 0x0000000F [ 2] literal string: infoDictionary
0x100EDC010 0x0000000E [ 2] literal string: objectForKey:
0x100EDC01E 0x0000000C [ 2] literal string: setAppName:
0x100EDC02A 0x0000000C [ 2] literal string: setVersion:
0x100EDC036 0x0000000C [ 2] literal string: setApiType:
0x100EDC042 0x00000009 [ 2] literal string: instance
0x100EDC04B 0x00000008 [ 2] literal string: isDebug
这部分保存了类里方法的字符串信息(所以原则上方法名起短一些,是可以减少占用的 - -!)
分析步骤:
- 查看第一列起始地址,然后在上面的段表中查看这个地址在那个节里,可以看到在
__objc_methname
中。 - 通过第二列对比大小
- 通过第三列解析对应的类和对应方法名称
1.2.4.3类列表节(__objc_classlist
)
0x1010E8080 0x00000008 [ 2] anon
0x1010E8088 0x00000008 [ 3] anon
0x1010E8090 0x00000008 [ 4] anon
0x1010E8098 0x00000008 [ 5] anon
0x1010E80A0 0x00000008 [ 7] anon
0x1010E80A8 0x00000008 [ 9] anon
0x1010E80B0 0x00000008 [ 10] anon
0x1010E80B8 0x00000008 [ 11] anon
0x1010E80C0 0x00000008 [ 12] anon
0x1010E80C8 0x00000008 [ 13] anon
0x1010E80D0 0x00000008 [ 14] anon
0x1010E80D8 0x00000008 [ 15] anon
0x1010E80E0 0x00000008 [ 16] anon
0x1010E80E8 0x00000008 [ 17] anon
0x1010E80F0 0x00000008 [ 18] anon
0x1010E80F8 0x00000008 [ 19] anon
0x1010E8100 0x00000038 [ 20] anon
0x1010E8138 0x00000030 [ 21] anon
__objc_classlist
存储了所有类的虚拟地址。即__objc_data
地址。这里都是二进制数据,具体保存了什么,看下对应的数据结构
__objc_data
的数据结构为:
typedef struct objc_class{
unsigned long long isa;
unsigned long long wuperclass;
unsigned long long cache;
unsigned long long vtable;
unsigned long long data;
unsigned long long reserved1;
unsigned long long reserved2;
unsigned long long reserved3;
}objc_class;
其中最主要的是data
字段,保存了_objc_const
节对应的数据地址。数据结构为:
typedef struct objc_classdata{
long long flags;
long long instanceStart;
long long instanceSize;
long long reserved;
unsigned long long ivarlayout;
unsigned long long name;
unsigned long long baseMethod;
unsigned long long baseProtocol;
unsigned long long ivars;
unsigned long long weakIvarLayout;
unsigned long long baseProperties;
}
这里面保存了类名,方法名,协议名,ivar指针和属性对应的地址。最后对应到相应的TEXT段里就能找到。比如类名在__objc_classname
可以找到,方法名可以在__objc_methname
。应用程序就是通过这个结构来寻找哪个类对应的那个方法,从而执行相关逻辑
1.3 如何找到没有用到的类和方法?
我们可以利用linkmap
和otools
结合来找到,具体看下面isee
的使用
-
找到哪些类没有使用
通过
__objc_classrefs
和link map中解析到的所有_objc_classname
对比就可以知道哪些类没用。其中__objc_classrefs
的解析需要通过otool命令才能解析,来找到使用到的class。可以用以下命令获取到所有解析成class
对象后的数据otool -V -o FFProject -arch arm64 | open -f
输出的数据中找到
Contents of (__DATA,__objc_classrefs) section
部分。Contents of (__DATA,__objc_classrefs) section 000000010003cc90 0x10003d348 _OBJC_CLASS_$_AFHTTPSessionManager 000000010003cc98 0x0 _OBJC_CLASS_$_NSDictionary 000000010003cca0 0x0 _OBJC_CLASS_$_UISceneConfiguration 000000010003cca8 0x10003d230 _OBJC_CLASS_$_AppDelegate 000000010003ccb0 0x0 _OBJC_CLASS_$_NSDate 000000010003ccb8 0x0 _OBJC_CLASS_$_NSString 000000010003ccc0 0x0 _OBJC_CLASS_$_NSMutableDictionary 000000010003ccc8 0x0 _OBJC_CLASS_$_NSUUID
-
找到哪些方法没有使用:
通过
__objc_selrefs
和_objc_methname
对比可以知道哪些方法没有使用到。其中__objc_selrefs
需要用otool命令才能解析,找到使用到的所有方法。otool -v -s __DATA __objc_selrefs <path>
1.2.4 otool使用
这个用来做反汇编的,比如分析哪些类被使用了,需要用这个工具。
比如获取使用到的方法可以用这个命令:
otool -V -s __DATA __objc_selrefs <path> -arch arm64 | open -f
其中path是你的应用编译后生成的可执行文件。通常在项目的DerivedData目录下的Build/Products//.app文件,然后显示包内容,有个和工程同名的可执行文件。比如我的目录:
/Users/bolei/Library/Developer/Xcode/DerivedData/FFProject-gqpkbetfhlofkxcmyfwpmkfqubun/Build/Products/Release-iphoneos/FFProject.app/FFProject
打印使用到的类: _objc_classrefs
otool -V -o FFProject -arch arm64 | open -f
可以打印出来objc Section中的所有数据
2. iSee使用
iSee是一款分析iOS可执行文件成分的工具,参考zyangSir的iSee工程做了修改,github地址 通过加载XCode在项目编译期间产生的linkMap文件,能够输出项目中每个类(包括第三方静态库),在最终可执行文件中占用的长度信息。本工具根据zyangSir的代码做了部分修改。主要功能有:
- 各个可执行文件占用大小
- 可执行文件中,各个段占用的大小(包括方法+常量字符串等)
- 未使用到的类
- 未使用到的方法
包括:
-
使用的所有库: custom是非系统库或第三方库
-
库里面用到的所有类
-
类里面所有节信息,Z开头的是辅助信息,记录使用到的类+方法和未使用的类+方法
-
节对应详情信息
-
未使用的类:
-
未使用的方法
2.1 使用方法
建议使用真机生成的文件测试,目前看对arm64架构支持最好。优先使用arm64相关文件检测。分析不了framework里面的,所以如果是cocoapods导入,建议去掉!framework
,使用静态库导入。强烈建议cocoapods使用静态库导入,会显著提升启动速度
2.1.1 导出生成linkmap文件
- 在XCode编译选项中打开”WriteLinkMapFile”
- 选择好真机(采用arm64架构的),选Debug。先编译项目,进入项目的Derived Data目录
- 依次进入Build/Intermediates/项目名.build/ 目录, 找到相应模式下的编译产物文件夹
- 可以看到一个名为 项目名-LinkMap-normal-CPU架构.txt的文件,在iSee中点击linkMap文件按钮,导入这个文件
2.1.2 导出生成的可执行文件
-
在上一步的Derived Data目录下,
在iSee中点击可执行文件,导入刚才的文件
之后程序会自动执行分析。
2.2 简单说明
- 现在对arm64支持比较好,所以建议用这个格式测试。可以在debug模式下,链接Arm64的机器,然后只编译生成此平台下的数据。
- 对于未使用方法和未使用类,使用otool工具来做辅助分析
- 未使用方法和未使用类,有误报可能,主要误报的是一些实现协议的类,这一部分是动态使用的,所以静态分析不出来。
- 目前没有对swift语言的分析。
2021-04-20 16:31:57.378513+0800 otool[82701:1827934] Failed to open macho file at /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/otool for reading: Too many levels of symbolic links
2021-04-20 16:31:57.571279+0800
2.3 原理说明
先读取linkmap
2.3.1 解析Object files
:
-
解析
Object files
, 按照行读取,使用正则解析@"\\[\\s*(\\d+)\\]\\s+(.+)"
每一行的数据,知道遇到# Sections:
停止。其中最后一个匹配到的是具体路径,可以切割后文件名,比如ViewController.o
,路径以user
开头的,就是用户代码,否则认为系统库代码。需要注意的是[数字]
,里面的数据是具体序号,需要按照顺序保存到数组中,供后续使用。# Object files: [ 0] linker synthesized [ 1] /Users/bolei/Library/Developer/Xcode/DerivedData/iSeeDemo-famzgrqugqqtpjfncdokvahyclhb/Build/Intermediates.noindex/iSeeDemo.build/Debug-iphoneos/iSeeDemo.build/Objects-normal/arm64/ViewController.o [ 2] /Users/bolei/Library/Developer/Xcode/DerivedData/iSeeDemo-famzgrqugqqtpjfncdokvahyclhb/Build/Intermediates.noindex/iSeeDemo.build/Debug-iphoneos/iSeeDemo.build/Objects-normal/arm64/AppDelegate.o [ 3] /Users/bolei/Library/Developer/Xcode/DerivedData/iSeeDemo-famzgrqugqqtpjfncdokvahyclhb/Build/Intermediates.noindex/iSeeDemo.build/Debug-iphoneos/iSeeDemo.build/Objects-normal/arm64/main.o [ 4] /Users/bolei/Library/Developer/Xcode/DerivedData/iSeeDemo-famzgrqugqqtpjfncdokvahyclhb/Build/Intermediates.noindex/iSeeDemo.build/Debug-iphoneos/iSeeDemo.build/Objects-normal/arm64/SceneDelegate.o [ 5] /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneOS.platform/Developer/SDKs/iPhoneOS14.4.sdk/System/Library/Frameworks//Foundation.framework/Foundation.tbd [ 6] /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneOS.platform/Developer/SDKs/iPhoneOS14.4.sdk/usr/lib/libobjc.tbd [ 7] /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneOS.platform/Developer/SDKs/iPhoneOS14.4.sdk/System/Library/Frameworks//UIKit.framework/UIKit.tbd
参考代码:
/**
* 解析目标文件log
*/
- (void)parseObjectFileLog
{
NSMutableArray *tmpArray = [NSMutableArray arrayWithCapacity: 100];
self.lastLineStr = [_linkMapfileReader readLine];
while (![self isSectionStartFlag: _lastLineStr]) {//如果没检测到下一段不同类型log的起始标识串,则继续
// NSLog(@"lastLine = %@",_lastLineStr);
if ([self.lastLineStr hasPrefix:@"#"]) {
self.lastLineStr = [_linkMapfileReader readLine];
continue;
}
NSString *regexStr = @"\\[\\s*(\\d+)\\]\\s+(.+)";
NSRegularExpression* regexExpression = [NSRegularExpression regularExpressionWithPattern:regexStr options:NSRegularExpressionCaseInsensitive error:nil];
NSArray* matchs = [regexExpression matchesInString:self.lastLineStr options:0 range:NSMakeRange(0, self.lastLineStr.length)];
if (matchs == nil || [matchs count] == 0) {
return;
}
NSTextCheckingResult *checkingResult = [matchs objectAtIndex:0];
if ([checkingResult numberOfRanges] < 3) {
return;
}
NSString *indexStr = [self.lastLineStr substringWithRange:[checkingResult rangeAtIndex:1]];//索引
NSUInteger index = indexStr.integerValue;
NSString *path = [self.lastLineStr substringWithRange:[checkingResult rangeAtIndex:2]];//索引
NSRange range = [path rangeOfString:@"/"];
ObjectFileItem * objFileItem = [[ObjectFileItem alloc] init];
if (range.location == NSNotFound) {
objFileItem.fileType = OBJECT_FILE_FROM_CUSTOM_CODE;
objFileItem.name = path;
objFileItem.module = @"Custom";
} else {
NSString *pathStr = [path substringFromIndex:range.location];
NSString * objectFileName = [pathStr lastPathComponent];
// NSLog(@"path = %@, fileName= %@",pathStr,objectFileName);
if ([pathStr hasPrefix: CUSTOM_LIB_PATH_PREFIX]) {
NSRange bracketRange = [objectFileName rangeOfString: @"("];
if (bracketRange.location != NSNotFound ) {
//静态库中的目标文件
objFileItem.module = [objectFileName substringToIndex:bracketRange.location];
objFileItem.fileType = OBJECT_FILE_FROM_STATIC_FILE;
NSRange objNameRange = bracketRange;
objNameRange.location ++;
objNameRange.length = objectFileName.length - (objNameRange.location + 1) - 1; //去掉两个括号
objFileItem.name = [objectFileName substringWithRange: objNameRange];
}else
{
//用户自行创建的类
objFileItem.fileType = OBJECT_FILE_FROM_CUSTOM_CODE;
objFileItem.name = objectFileName;
objFileItem.module = @"Custom";
}
}else if ([pathStr hasPrefix: SYSTEM_LIB_PATH_PREFIX])
{ //系统库目标文件
objFileItem.fileType = OBJECT_FILE_FROM_SYSTEM_LIB;
objFileItem.name = objectFileName;
objFileItem.module = @"System";
}
double progress = [_linkMapfileReader readedFileSizeRatio];
[self updateAnalyzeProgress: progress];
}
if (tmpArray.count > index) {
[tmpArray replaceObjectAtIndex:index withObject:objFileItem];
} else {
[tmpArray addObject:objFileItem];
}
// one loop end, start parsing next line log
self.lastLineStr = [_linkMapfileReader readLine];
double progress = [_linkMapfileReader readedFileSizeRatio];
[self updateAnalyzeProgress: progress];
}
self.objectFileArray = [NSArray arrayWithArray: tmpArray];
}
2.3.2 解析section
表
这里保存了每个段的保存地址,需要保存下来,后面用于匹配在哪个段和节中。
数据为:
# Sections:
# Address Size Segment Section
0x100006328 0x0001D970 __TEXT __text
0x100023C98 0x00000570 __TEXT __stubs
0x100024208 0x00000588 __TEXT __stub_helper
0x100024790 0x00005E1A __TEXT __objc_methname
0x10002A5AA 0x00002CCD __TEXT __cstring
0x10002D277 0x000004DE __TEXT __objc_classname
0x10002D755 0x00001AB0 __TEXT __objc_methtype
0x10002F208 0x00000028 __TEXT __const
0x10002F230 0x00000448 __TEXT __gcc_except_tab
0x10002F678 0x0000014A __TEXT __ustring
0x10002F7C4 0x000007C0 __TEXT __unwind_info
0x10002FF88 0x00000074 __TEXT __eh_frame
0x100030000 0x000000E8 __DATA __got
0x1000300E8 0x000003A0 __DATA __la_symbol_ptr
0x100030488 0x00000850 __DATA __const
0x100030CD8 0x00001120 __DATA __cfstring
0x100031DF8 0x00000108 __DATA __objc_classlist
0x100031F00 0x00000008 __DATA __objc_nlclslist
0x100031F08 0x00000038 __DATA __objc_catlist
0x100031F40 0x00000088 __DATA __objc_protolist
0x100031FC8 0x00000008 __DATA __objc_imageinfo
0x100031FD0 0x00009830 __DATA __objc_const
0x10003B800 0x00001480 __DATA __objc_selrefs
0x10003CC80 0x00000010 __DATA __objc_protorefs
0x10003CC90 0x00000228 __DATA __objc_classrefs
0x10003CEB8 0x000000D0 __DATA __objc_superrefs
0x10003CF88 0x0000022C __DATA __objc_ivar
0x10003D1B8 0x00000A50 __DATA __objc_data
0x10003DC08 0x00000680 __DATA __data
0x10003E288 0x000000C0 __DATA __bss
也按照顺序保存到数组里。解析代码:
/**
* 解析段表log
*/
- (void)parseSectionTableLog
{
NSMutableArray *tmpArray = [[NSMutableArray alloc] initWithCapacity: 50];
self.lastLineStr = [_linkMapfileReader readLine];
// NSLog(@"parseSectionTableLog = %@",self.lastLineStr);
while (![self isSectionStartFlag: _lastLineStr]) {
if ([self.lastLineStr hasPrefix:@"#"]) {
self.lastLineStr = [_linkMapfileReader readLine];
continue;
}
NSArray *oneLineConponents = [_lastLineStr componentsSeparatedByString:@"\t"];
NSString *address = oneLineConponents[0];
NSString *sizeStr = oneLineConponents[1];
NSString *segmentTypeStr = oneLineConponents[2];
NSString *sectionNameStr = oneLineConponents[3];
// NSLog(@"address = %@, sizeStr = %@ segmentTypeStr = %@ sectionNameStr = %@",address,sizeStr,segmentTypeStr,sectionNameStr);
ExecutableCodeItem *codeItem = [[ExecutableCodeItem alloc] init];
codeItem.size = strtoul([sizeStr UTF8String], 0, 16);
NSUInteger lastIndex = [sectionNameStr length] - 1;//2 是制表符 \t 的两个字符位移
codeItem.name = [sectionNameStr substringToIndex: lastIndex];
codeItem.startAddress = strtoul([address UTF8String], 0, 16);
if ([segmentTypeStr isEqualToString: SEGMENT_TYPE_CODE]) {
codeItem.segmentType = CodeType_TEXT;
}else if ([segmentTypeStr isEqualToString: SEGMENT_TYPE_DATA])
{
codeItem.segmentType = CodeType_DATA;
}
[tmpArray addObject: codeItem];
//one loop end , start next circle
self.lastLineStr = [_linkMapfileReader readLine];
[self updateAnalyzeProgress: _linkMapfileReader.readedFileSizeRatio];
}
[self updateAnalyzeProgress: _linkMapfileReader.readedFileSizeRatio];
self.executableCodeArray = [NSArray arrayWithArray: tmpArray];
}
2.3.3 解析符号表
后面的数据,会按照地址顺序,打印相关内容,也按行解析,匹配正则@"(.+?)\\t(.*?)\\t\\[\\s*(\\d+)\\]\\s+(.+)"
。。其中[数字]
就是匹配的上面第一步里解析Object files
里面的.o
文件,通过序号匹配就能找到对应的是哪个文件里的内容。通过起始地址就能解析出来具体属于哪个节section
。通过Size就能算出这个方法占用的大小。
# Symbols:
# Address Size File Name
0x100006328 0x00000114 [ 1] -[ViewController viewDidLoad]
0x10000643C 0x00000028 [ 1] ___29-[ViewController viewDidLoad]_block_invoke
0x100006464 0x00000028 [ 1] ___29-[ViewController viewDidLoad]_block_invoke_2
0x10000648C 0x00000008 [ 2] -[AppDelegate application:didFinishLaunchingWithOptions:]
0x100006494 0x0000008C [ 2] -[AppDelegate application:configurationForConnectingSceneSession:options:]
0x100006520 0x00000004 [ 2] -[AppDelegate application:didDiscardSceneSessions:]
0x100006524 0x00000080 [ 3] _main
0x1000065A4 0x00000004 [ 4] -[SceneDelegate scene:willConnectToSession:options:]
0x1000065A8 0x00000004 [ 4] -[SceneDelegate sceneDidDisconnect:]
0x1000065AC 0x00000004 [ 4] -[SceneDelegate sceneDidBecomeActive:]
0x1000065B0 0x00000004 [ 4] -[SceneDelegate sceneWillResignActive:]
0x1000065B4 0x00000004 [ 4] -[SceneDelegate sceneWillEnterForeground:]
0x1000065B8 0x00000004 [ 4] -[SceneDelegate sceneDidEnterBackground:]
0x1000065BC 0x00000010 [ 4] -[SceneDelegate window]
0x1000065CC 0x00000014 [ 4] -[SceneDelegate setWindow:]
0x1000065E0 0x00000014 [ 4] -[SceneDelegate .cxx_destruct]
0x1000065F4 0x0000014C [ 5] -[AFCachedImage initWithImage:identifier:]
0x100006740 0x00000064 [ 5] -[AFCachedImage accessImage]
0x1000067A4 0x000000A4 [ 5] -[AFCachedImage description]
0x100006848 0x00000008 [ 5] -[AFCachedImage image]
0x100006850 0x0000000C [ 5] -[AFCachedImage setImage:]
0x10000685C 0x0000000C [ 5] -[AFCachedImage identifier]
解析代码:
/**
* 解析一行符号log
*
* @param oneLineLog 一行符号log
*
* @return 解析结果
*/
- (void)parseOneLineSymbolLog:(NSString *)oneLineLog
{
// NSLog(@"parseOneLineSymbolLog = %@", oneLineLog);
//过滤非目标串
NSString *filtreString = @"\t * \n * \x10\n * %@\n * \r\n";
NSRange range = [filtreString rangeOfString: oneLineLog];
if (range.location != NSNotFound) {
return;
}
NSString *regexStr = @"(.+?)\\t(.*?)\\t\\[\\s*(\\d+)\\]\\s+(.+)";
NSRegularExpression* regexExpression = [NSRegularExpression regularExpressionWithPattern:regexStr options:NSRegularExpressionCaseInsensitive error:nil];
NSArray* matchs = [regexExpression matchesInString:oneLineLog options:0 range:NSMakeRange(0, oneLineLog.length)];
if (matchs == nil || [matchs count] == 0) {
return;
}
NSTextCheckingResult *checkingResult = [matchs objectAtIndex:0];
if ([checkingResult numberOfRanges] < 5) {
return;
}
NSString *startAddressStr = [oneLineLog substringWithRange:[checkingResult rangeAtIndex:1]];//起始地址
NSString *sizeStr = [oneLineLog substringWithRange:[checkingResult rangeAtIndex:2]];//空间大小
NSString *indexStr = [oneLineLog substringWithRange:[checkingResult rangeAtIndex:3]];//索引
NSString *name = [oneLineLog substringWithRange:[checkingResult rangeAtIndex:4]];//名称
long startAddress = strtoul([startAddressStr UTF8String], 0, 16);
long size = strtoul([sizeStr UTF8String], 0, 16);
NSUInteger index = indexStr.integerValue;
ExecutableCodeItem *executable = [self excutableItem:startAddress];//段名称
//添加到所属的目标文件
if (index < _objectFileArray.count) {
ObjectFileItem *targetObjectFile = _objectFileArray[ index ];
targetObjectFile.size += size;
ObjectSecionItem *section = [targetObjectFile.sectionDictionary objectForKey:executable.name];
if (section == nil) {
section = [[ObjectSecionItem alloc] init];
section.name = executable.name;
section.fileTypeName = executable.segmentTypeStr;
[targetObjectFile.sectionDictionary setObject:section forKey:executable.name];
}
section.size += size;
MethodFileItem *funcItem = [[MethodFileItem alloc] init];
funcItem.name = name;
funcItem.size = size;
funcItem.fileTypeName = executable.name;
funcItem.startAddress = startAddress;
[section.objectsList addObject:funcItem];
// NSLog(@"startAddress = %@ size = %@ index = %@ name = %@ target = %@ section = %@",startAddressStr,sizeStr,indexStr,name,targetObjectFile, executable.name);
}
}
到这里整个linkmap
就解析完成了。接着使用otools
来解析具体二进制文件。(备注:这里为啥要用otools解析,原因是objc_selrefs
和__objc_classrefs
记录了程序中用到的方法和类,但linkmap里面只有二进制数据,需要进一步解析成具体数据结构,这个就需要依赖otools来做)。
2.3.4 利用otools解析使用到的所有方法和未使用的所有方法
运行otool -v -s __DATA __objc_selrefs <path>
,输出__objc_selrefs
内容。
Contents of (__DATA,__objc_selrefs) section
000000010003b800 __TEXT:__objc_methname:viewDidLoad
000000010003b808 __TEXT:__objc_methname:manager
000000010003b810 __TEXT:__objc_methname:dictionaryWithObjects:forKeys:count:
000000010003b818 __TEXT:__objc_methname:GET:parameters:headers:progress:success:failure:
000000010003b820 __TEXT:__objc_methname:role
000000010003b828 __TEXT:__objc_methname:initWithName:sessionRole:
000000010003b830 __TEXT:__objc_methname:class
000000010003b838 __TEXT:__objc_methname:init
000000010003b840 __TEXT:__objc_methname:setImage:
000000010003b848 __TEXT:__objc_methname:setIdentifier:
000000010003b850 __TEXT:__objc_methname:size
000000010003b858 __TEXT:__objc_methname:scale
000000010003b860 __TEXT:__objc_methname:setTotalBytes:
000000010003b868 __TEXT:__objc_methname:date
000000010003b870 __TEXT:__objc_methname:setLastAccessDate:
...
获取之后先通过正则解析(.+?)\\s+__TEXT:__objc_methname:(.+)
, 解析出来起始地址,方法名称比如viewDidLoad
。接着需要找到这个方法对应调用的类是什么。这个需要使用前面前面解析linkmap
用到的数据,算法是:
- 按照顺序从前面o文件列表里面搜索,取到每个类对应的
__objc_selrefs
数据。 - 然后从
__objc_selrefs
中,比对数据里面那个起始地址一致,说明这个数据就属于这个类。 - 然后把这个方法记录到已经使用的方法列表里面。
- 解析是否有
__objc_ivar
段,比如_OBJC_IVAR_$_AFSecurityPolicy._pinnedPublicKeys
,说明是属性,需要把_pinnedPublicKeys
和setPinnedPublicKeys
也加入到方法列表里面。 - 检索上一步
linkmap
中的__objc_methname
里面的数据,literal string: scene:willConnectToSession:options:
, 从第三步骤记录的所有使用的方法查看是否有使用,没有使用就写入未使用方法列表里面。
有部分代码可能比较绕,其实主要是为了加速搜索。因为地址是一直递增的,所以不会每次搜索都从刚开始检索,而是从上次的结果之后来检索。
- (void)anylyzeUsedMethodWithData:(NSString *)string {
// 解析结果,分解数据
if (string.length) {
//数据清空
for (ObjectFileItem *file in self.resultList) {
[file.usedMethod removeAllObjects];
[file.unUsedMethod removeAllObjects];
}
//解析 0000000100dcd9c0 __TEXT:__objc_methname:alloc
NSArray *lines = [string componentsSeparatedByString:@"\n"];
NSString *regexStr = @"(.+?)\\s+__TEXT:__objc_methname:(.+)";
NSRegularExpression* regexExpression = [NSRegularExpression regularExpressionWithPattern:regexStr options:NSRegularExpressionCaseInsensitive error:nil];
int objIndex = 0; //扫描的obj的索引
int methodIndex = 0; //扫描到的方法索引
// 解析出来使用到的方法
for (NSString *line in lines) {
@autoreleasepool {
if (objIndex >= [self.resultList count]) {
break;
}
NSArray* matchs = [regexExpression matchesInString:line options:0 range:NSMakeRange(0, line.length)];
if (matchs == nil || [matchs count] == 0) {
continue;
}
NSTextCheckingResult *checkingResult = [matchs objectAtIndex:0];
if ([checkingResult numberOfRanges] < 3) {
continue;
}
NSString *startAddressStr = [line substringWithRange:[checkingResult rangeAtIndex:1]];
NSString *method = [line substringWithRange:[checkingResult rangeAtIndex:2]];
long startAddress = strtoul([startAddressStr UTF8String], 0, 16);
ObjectSecionItem *section = nil;
ObjectFileItem *obj = nil;
//需要找到对应哪个类的起始地址
while (objIndex < [self.resultList count]) {
obj = [self.resultList objectAtIndex:objIndex];
section = [obj.sectionDictionary objectForKey:@"__objc_selrefs"];
MethodFileItem *method = [section.objectsList lastObject];
if (method.startAddress < startAddress) {
objIndex ++;
methodIndex = 0;
}else {
break;
}
}
if (objIndex >= [self.resultList count]) {
break;
}
//数据其实是一一对应的,如果没找到可能是异常了
// 从第0个开始找,如果找到了,就放在usedMethod里面,并继续循环
MethodFileItem *methodItem = [section.objectsList objectAtIndex:methodIndex];
if (methodItem.startAddress == startAddress) {
methodItem.name = method;
[obj.usedMethod setObject:methodItem forKey:method];
methodIndex ++;
continue;
}
// 如果没找到,循环遍历查找,找到后放入,,标记下methodIndex,并继续循环
for (int j = 0; j < [section.objectsList count]; j ++) {
MethodFileItem *methodItem = [section.objectsList objectAtIndex:j];
if (methodItem.startAddress == startAddress) {
//获取到
methodIndex = j;
[obj.usedMethod setObject:methodItem forKey:method];
break;
}
}
}
}
//填充数据
for (ObjectFileItem *obj in self.resultList) {
ObjectSecionItem *allIvarSection = [obj.sectionDictionary objectForKey:@"__objc_ivar"];
for (MethodFileItem *method in allIvarSection.objectsList) {
NSRange range = [method.name rangeOfString:@"." options:NSBackwardsSearch];
if (range.location == NSNotFound) {
continue;
}
//从_开始 0x100DF2014 0x00000004 [ 16] _OBJC_IVAR_$_AFSecurityPolicy._pinnedPublicKeys
//0x100DF44BC 0x00000004 [723] _OBJC_IVAR_$_HFDataBaseCore.dbPath
NSString *methodStr = [method.name substringFromIndex:range.location + 1];
if ([methodStr hasPrefix:@"_"]) {
methodStr = [methodStr substringFromIndex:1];
if ([methodStr length] > 1) {
NSString *_methodStr = [NSString stringWithFormat:@"_%@",methodStr];
NSString *setMethod = [NSString stringWithFormat:@"set%@%@:",[methodStr substringToIndex:1].uppercaseString,[methodStr substringFromIndex:1]];
[obj.usedMethod setObject:method forKey:_methodStr];
[obj.usedMethod setObject:method forKey:setMethod];
}
}
[obj.usedMethod setObject:method forKey:methodStr];
}
ObjectSecionItem *allClassSection = [obj.sectionDictionary objectForKey:@"__objc_methname"];
NSMutableDictionary *usedMethod = obj.usedMethod;
for (MethodFileItem *method in allClassSection.objectsList) {
NSString *methodStr = [method.name substringFromIndex:@"literal string: ".length];
if ([usedMethod objectForKey:methodStr]) {
continue;
}
[obj.unUsedMethod setObject:method forKey:methodStr];
MethodFileItem *unUsedMethod = [MethodFileItem new];
unUsedMethod.size = method.size;
unUsedMethod.fileTypeName = method.fileTypeName;
unUsedMethod.startAddress = method.startAddress;
unUsedMethod.name = [NSString stringWithFormat:@"[%@ %@]",obj.name,methodStr];
[self.unUsedSelectorList addObject:unUsedMethod];
}
if ([obj.unUsedMethod count] > 0) {
ObjectSecionItem *unusedSection = [[ObjectSecionItem alloc] init];
unusedSection.name = @"Z__unused_selector";
unusedSection.fileTypeName = @"Custom";
unusedSection.size = [obj.unUsedMethod count];
[unusedSection.objectsList addObjectsFromArray:[obj.unUsedMethod allValues]];
[obj.sectionDictionary setObject:unusedSection forKey:@"Z__unused_selector"];
}
if ([obj.usedMethod count] > 0) {
ObjectSecionItem *usedSection = [[ObjectSecionItem alloc] init];
usedSection.name = @"Z__used_selector";
usedSection.fileTypeName = @"Custom";
usedSection.size = [obj.usedMethod count];
[usedSection.objectsList addObjectsFromArray:[obj.usedMethod allValues]];
[obj.sectionDictionary setObject:usedSection forKey:@"Z__used_selector"];
}
}
}
}
2.3.5 利用otools解析使用到的所有类和未使用的类
接着和上面的类似,解析出来__objc_selrefs
的内容就可以得到所有使用的class, 但是注意的是通过命令otool -V -s __DATA __objc_classrefs
输出的是二进制的信息。所以需要用otool -V -o <path>
,输出OC解析后的内容。找到Contents of (__DATA,__objc_classrefs) section
Contents of (__DATA,__objc_classrefs) section
000000010003cc90 0x10003d348 _OBJC_CLASS_$_AFHTTPSessionManager
000000010003cc98 0x0 _OBJC_CLASS_$_NSDictionary
000000010003cca0 0x0 _OBJC_CLASS_$_UISceneConfiguration
000000010003cca8 0x10003d230 _OBJC_CLASS_$_AppDelegate
000000010003ccb0 0x0 _OBJC_CLASS_$_NSDate
000000010003ccb8 0x0 _OBJC_CLASS_$_NSString
000000010003ccc0 0x0 _OBJC_CLASS_$_NSMutableDictionary
获取之后先通过正则解析(.+?)\\s+(.+?)\\s+_OBJC_.+_\\$_(.+)
, 解析出来起始地址,使用的类名比如_OBJC_CLASS_$_AFHTTPSessionManager
。并把他关联到具体使用的拿个类里面。然后利用linkmap
中的__objc_classname
来做对比,还要把继承的协议(__objc_protolist
)也作为使用的类。 思路和前面的一致,详细请参考具体源码。
2.5 代码参考
相关代码欢迎fork:https://github.com/dishibolei/iSee.git
主要功能包含了
- 代码占用分析
- 未使用类分析
- 未使用方法分析