目录
- 简述
- Mach
- 任务与线程
- 端口
- 虚拟地址
- 任务地址空间
- BSD
- I/O kit
简述
XNU内核是iOS的核心,与OS X版本几乎没有区别,是由三个主要部分组成的一个分层体系结构。大致结构如图所示,画得有点丑。
该内核的内环是Mach层,该层仅仅提供了例如调度、IPC等基础服务。这些服务都是为内核提供的。
第二个部分是BSD层,BSD层主要是为用户层面提供一些接口,为一些操作提供支持,网络、进程管理、文件系统。
最后一个部分就是I/O Kit,顾名思义,为设备的驱动程序提供面向对象的框架。
由于作者知识有限,只能把一些知道的知识点陈述出来,因此知识点看起来会有一些零散难以理解。另文章难免会出现一些错漏的地方,还望指出以便于及时更改防止误导他人。
Mach
Mach前面已经说过了,为高层提供底层服务。关于Mach的官方文档在这里(建议翻墙打开)
Mach提供了一组简单又强大的抽象用于实现基础服务。
- 任务(Task).每一个任务都包含着一个虚拟空间、一个端口命名空间以及一个或多个线程,跟进程类似。(下文的进程和任务可能有些混乱,但不耽误理解)
- 线程(Thread).CPU执行最小单位。
- 地址空间(Address space).Mach使用地址空间与内存管理器,实现了不连续的虚拟地址空间以及共享内存的概念。
- 内存对象(Memory object).它是内存管理的内部单元。
- 端口(Ports).单工通信通道,只能发送或者通过端口权限访问。
- IPC
- 时钟(Time)
下面就讲一下Mach中经常被提及的一点概念,IPC与消息可以移步这里。
任务与线程
OS X进程,POSIX thread(pthread)都是基于Mach中任务与线程实现的。任务为线程提供资源,这种靠任务划分的方式大大提高了资源的共享性。
对于一个线程来说,它
- 是任务的控制流点。
- 可以访问任务中所有的元素。
- 可以与同任务中另一线程并行执行。
- 有自己的状态,包括处理器状态以及自己的栈。
对于任务来说,它
- 是一个资源的集合体,它的资源除了地址空间以外,可以通过端口获取。如果另一个任务需要访问该资源,它直接传递端口权限就好。
- 提供一个不连续的地址空间。这个空间的部分可以通过继承或者外部内存管理器来共享出去。
- 包含一个或多个线程。
端口
端口是请求服务的客户端与提供服务的服务器之间单向通信的端点,除了任务地址空间以外,所有其他Mach资源都可以通过端口访问。一个端口可以接收多个发送者的消息,但每个,端口只能有一个接收器。换句话说就是禁止群发。
为了保证端口安全,防止资源外泄,端口还有保护机制,称之为端口权限。为了与端口交互,任务必须要有正确的端口权限。端口权限与任务相关,因此,任务里的所有线程都共享相同的端口权限。权限还可以在任务之间复制和移动,但有一点,如果在父进程中fork出子进程,那么子进程是没有和父进程一样的权限的。关于端口的权限,定义在mach/port.h中,用xcode就能看到。
typedef natural_t mach_port_right_t;
#define MACH_PORT_RIGHT_SEND ((mach_port_right_t) 0)//允许发送消息
#define MACH_PORT_RIGHT_RECEIVE ((mach_port_right_t) 1)//允许接收消息
#define MACH_PORT_RIGHT_SEND_ONCE ((mach_port_right_t) 2)//允许发送消息一次
#define MACH_PORT_RIGHT_PORT_SET ((mach_port_right_t) 3)//面向一组端口接收或发送消息
#define MACH_PORT_RIGHT_DEAD_NAME ((mach_port_right_t) 4)//无效或销毁的权限
#define MACH_PORT_RIGHT_LABELH ((mach_port_right_t) 5)
#define MACH_PORT_RIGHT_NUMBER ((mach_port_right_t) 6)
虚拟地址
要说虚拟地址,得先从虚拟内存讲起,虚拟地址指向的内存就是虚拟内存。由于计算机系统的RAM资源有限,当系统分配的内存太多时,RAM很有可能不够用,因此现代操作系统都使用一种虚拟内存技术来解决RAM不够的问题。
虚拟内存,顾名思义就是虚拟的内存,这样进程就可以分配和使用比系统RAM还要多的内存,它把超过RAM的地址空间放入到外部存储器(硬盘)上。可是问题又来了,CPU不能直接访问外部存储器的地址。因此,操作系统必须在外部存储器和RAM之间交换数据,以便于CPU能访问外部存储器的数据。一般来说,进程只需要使用分配的总内存的一小部分,我们把这部分分为工作集。由于硬盘的读取速度远远小于RAM的读取速度,因此,为了忽略虚拟内存给执行速度带来的影响,如果进程需要访问硬盘地址,操作系统会将硬盘存储的数据先读取到RAM中,如果RAM已经满了,没有空间可以放入数据,那么系统会先把RAM的一些数据放入到硬盘中,腾出空间再读取。
谈到虚拟内存,那就不得不谈起分页。上文说到RAM会与硬盘的数据会进行交换。分页技术将物理内存(RAM+硬盘)分成固定长度的块,称为页帧,将虚拟内存也划分成固定长度的块,称为页。每页与每帧的大小相同,这样就可以将每页映射到每帧中。
如图所示,虚拟内存中的每一页都对应着物理内存的每一帧。既然将进程分配的空间"打散"了,那么进程分配的物理空间就可以不连续,进程分配的空间只需要在虚拟空间中连续就好,虚拟空间映射成的物理空间可以七零八落分配在各个地方,这样做就解决了物理空间碎片化的的问题,提高了物理空间的利用率。
可能到这里有人会问了,进程怎么知道自己分配的内存是在RAM中还是在硬盘中。在进程启动的时候,操作系统会给它创建一个表,用于保存进程的虚拟空间地址以及其对应的物理地址的映射关系,这个表被称为分页表。这个表中的每一项对应进程地址空间中的每一页,换句话说它也和物理空间帧一一对应。这个分页表的项还包含着访问控制位(判断是否只读)与标志位(在RAM还是硬盘)。也就是说,有了进程的虚拟地址,系统就可以根据分页表中的映射关系找到它的物理地址,无论它在哪。
其实上面扯了那么多,iOS根本就不支持外部存储器(硬盘),但是这种内存分配方式(虚拟映射物理)还是有好处的,把虚拟内存化整为零可以大大的减少物理内存的碎片的产生。另一个好处就是进程可以完全使用自己的虚拟内存空间,不用在乎物理空间,当然这只是理论上的完全使用,具体原因见下文。
任务地址空间
在用户每一个进程的虚拟内存中,都有一段空间是专门为内核保留的。具体原因见巨内核优点。
在64-bit架构中,内核预留的空间跟32-bit不太一样。64-bit理论上的地址空间可以使用0-0xffffffffffffffff(2^64)。但是由于当时硬件并不能支持64位寻址空间,因此用户只能使用48位的寻址空间,后来就一直延续下来了。既然在64-bit下只能使用48位寻址空间,那么必须要用一些规范来对地址进行约束。约定地址第48-63位必须与47位相等。这就是规范形式地址,因此64位的地址空间被分为了两个部分。0-0x00007fffffffffff,0xffff800000000000-0xffffffffffffffff。这两个部分每一个部分都是128T,高128T字节预留给内核,低128T字节属于用户自己使用的,用户如果意图访问虚拟空间中的内核地址,则会报错。如果访问了中间非规范形式的地址,硬件会报错。映射关系如图所示。
BSD
BSD层位于Mach上层,但还是处于内核之中。它实现了很多操作系统的核心功能,这些功能的实现都建立在Mach提供的服务之上。BSD层提供了如下服务:
- 进程和用户管理
- 文件管理
- 安全
- 内存管理
- 驱动程序
- 网络连接
- 系统调用
I/O Kit
I/O Kit是一个面向对象的框架,用于编写设备驱动程序及其他内核扩展。I/O Kit对系统硬件进行了抽象,提前定义了许多类型的硬件基类,可以让新的驱动程序去继承这些基类,从而实现代码的高度重用。