讲的是大概原理,如果需要详细了解的同学,不建议参考本文章
程序的加载
一个APP是怎么运行起来的呢,首先是应用商店下载APP到手机。下载的这个实际上是一个可执行文件(忽略加密),下载到手机的硬盘上,比如说APP大小是90M,那就在硬盘占了90M的空间,等咱们点击桌面的图标,APP的可执行文件会从硬盘加载到内存,然后开始运行对应的代码
APP在硬盘上占90M,但是当刚APP启动时硬盘中的可执行文件会加载多少到内存呢,如果不知道虚拟内存这个概念,咱们可能会认为会把整个APP都加载到内存中去,那就是90M。如下图所示,假设说APP在硬盘上的地址是0xffffe000 ~ 0xffffe016(举例用),点击桌面图标后运行会把0xffffe000 ~ 0xffffe016中的代码加载到内存
但是实际上不是这样的,而是一部分一部分往内存加载的。可以粗略的理解为,需要运行啥了,就把那部分代码加载进去,比如说打开APP的第一个界面是聊天信息界面,那就只加载相关的代码,比如说只加载0xffffe000 ~ 0xffffe00f,等点击另一个界面的时候,再加载对应的代码,比如说0xffffe010 ~ 0xffffe016
虚拟内存
那是不是用到哪一行代码就加载哪一行代码? 答案是否定的,因为每次从硬盘加载数据到内存这个过程是很费时间的,如果一行一行的加载,你会感觉APP很卡,很影响体验,所以会有一个加载的最小单位,这个最小单位被称为页,在ARM64上一个页的大小是16k,也就是一次加载的代码最少是16k(咱们的图片为了方便举例说明,没遵守这个大小)
那是怎么做到的用到哪页就加载哪页呢,这就出现了虚拟地址空间的概念,如上图,APP的代码在硬盘上的地址是0xffffe000 ~ 0xffffe00f,那咱们就创建一个数组,数组里就专门存储APP在硬盘里的对应的地址,这个数组,就称为虚拟地址空间。
-
没有虚拟地址空间这个概念之前咱们以为运行APP的时候,操作系统是直接将APP在硬盘中的内容加载到内存,有了这个虚拟地址之后就变了,不是直接访问磁盘,而是先访问这个数组里的虚拟地址,然后拿着这个虚拟地址通过一个页表去查询当前地址所在的页是否已经加载到内存了,如果之前已经加载到内存了,会给出在内存中的地址然后直接访问对应的内存,如果没有加载到内存,则会产生一个缺页机制,就是说对应的页没有在内存,然后会从硬盘找到对应的页,加载到内存,然后更新页表。大概意思呢就是如下图
总结
虚拟地址这个逻辑的构成:虚拟地址空间(存虚拟地址)、页表(虚拟地址对应的内容在哪,页表记录着虚拟内存页到物理内存页的映射关系以及相关的权限)
-
虚拟地址的好处:
- 解决空间问题,不把所有文件加载到内存,节省内存空间,这样可以运行多个APP
- 防止不属于自己的内存区域或者自己的内存区域但是没权限修改的地址的内容被无意修改,因为页表不止记录着映射关系,还记录的权限相关的内容
- 不同进程(也就是不同的APP)之间的不同虚拟地址可以映射到相同的物理页号。这样可以解决动态库的共享加载问题,比如UIKit这个系统框架库在第一个进程运行时被加载到内存中,那么当第二个进程运行时并且需要UIKit库时就不再需要重新从文件加载内存中而是共享已经加载到物理内存的UIKit动态库
应用举例
最近传的比较多的抖音二进制重排,目的就是将启动APP需要运行的代码,尽量放到一起,这样就可以用最短的时间将代码加载到内存,达到更快的启动APP。举例说明:咱们上面说了,从硬盘往内存加载的最小单位是页,一页是16k,假如我启动APP需要运行的代码的大小是32k,如果都集中在2页里,那只需从硬盘往内存加载2次APP就启动完了。如果分散在8页里,那就需要从硬盘往内存加载8次APP才启动完,因为当访问虚拟地址时,如果对应的代码没在内存里,会触发缺页(Page Fault),然后会动硬盘里加载对应的页到内存,这个是很耗时间的。