1 硬件
三个部件最为关键:CPU、内存、I/O控制芯片
北桥芯片:协调CPU、内存和高速的图形设备(高速交换数据)
南桥芯片:专门处理低速设备的南桥芯片,磁盘、USB、键盘、鼠标等设备都连接在南桥上
2 计算机软件体系结构
2.1 系统软件可以分为两个部分
1)平台性
比如操作系统内核、驱动程序、运行库和系统工具
2)用于程序开发的
比如编译器、汇编器、链接器和开发库
2.2 接口
层次间的通信协议。接口下面那层是接口的提供者,由它定义接口,接口上面那层是接口的使用者,实现所需要的功能。
1)API(编写开发工具和应用程序):API的提供者是运行库,比如linux的glibc提供posix的API,windows运行库提供windows API。开发工具与应用程序都属于同一个层次,他们使用操作系统踢动的API。
2)系统调用接口(编写运行库):系统调用接口在实现中往往以软件中断的方式提供,比如Linux使用0x80号中断作为系统调用接口,windows使用0x2E号中断作为系统调用接口(后面有变化)
3)硬件规格(编写驱动):操作系统内核层对于硬件来说是硬件接口的使用者,而硬件是接口的定义者,硬件的接口定义决定了操作系统内核,具体来讲就是驱动程序如何操作硬件,如何与硬件进行通信。
3 操作系统
3.1 CPU资源(不让CPU打盹;CPU的抽象和共享)
1)多道程序
调度策略太粗糙,程序之间不分轻重缓急
2)分时系统
每个程序运行一段时间以后都主动让出CPU给其他程序。
3)多任务系统
操作系统接管了所有的硬件资源,并且本身运行在一个受硬件保护的级别。所有的应用程序都以进程的方式运行在比操作系统权限更低的级别,每个进程都有自己独立的地址空间。CPU由操作系统统一进行分配。抢占式:操作系统可以强制剥夺CPU资源并且分配给它认为目前最需要的进程。
3.2 I/O设备资源——设备驱动(I/O设备的共享和抽象)
在UNIX中,硬件设备的访问形式跟访问普通的文件形式一样;在Windows中,图像硬件被抽象成GDI,声音和多媒体设备被抽象成DirectX对象,硬盘被抽象成了普通的文件系统。
繁琐的硬件细节交给了操作系统中的硬件驱动程序来完成。
驱动程序的开发工作通常由硬件生成厂商完成,操作系统的开发者为硬件生产厂商提供一系列接口和框架,凡是按照这个接口和框架开发的驱动程序都可以在该操作系统上使用。
3.3 内存资源(虚拟地址;抽象和共享)
分段:大粒读
分页:小粒度
总结:
CPU->进程
I/O设备->设备驱动模型(具体情况?)
盘面、磁道位置->LBA逻辑扇区号
物理内存->虚拟内存
4 线程
4.1 线程的概念
程序执行流的最小单元。
一个标准线程由线程ID、当前指令指针(PC)、寄存器集合和堆栈组成。
通常,一个进程由一个到多个线程组成,各个线程共享程序的内存空间(包括代码段、数据段、堆等)及一些进程级资源(如打开的文件和信号)
多线程的优势:
4.2 线程访问权限
1)栈
2)线程局部存储(Thread Local Storage, TLS)
3)寄存器(包括PC寄存器)
4.3 线程调度和优先级
线程调度中,线程通常拥有至少三种状态:
1)运行:此时线程正在执行
2)就绪:此时线程可以立刻运行,但CPU已经被占用
3)等待:此时线程正在等待某一件事(通常是I/O或同步)发生,无法执行
在优先级调度的环境下,线程的优先级改变一般有三种方式:
1)用户指定优先级
2)根据进入等待状态的频繁程度提升或降低优先级
3)长时间得不到执行而被提升优先级
linux写时复制的机制
linux将所有的执行实体(无论是线程还是进程)都成为task,每一个任务概念上都类似于一个单线程的进程,具有内存空间、执行实体、文件资源。共享了同一个内存空间的多个任务构成了一个进程,这些任务也就成了这个进程里面的线程。
4.4 线程安全
多线程程序出于一个多边的环境中,可访问的全局变量和堆数据随时都可能被其他的线程改变。因此多线程程序在并发时数据的一致性变得非常重要。
1)竞争和原则操作(++i)
step1.读取i到某个寄存器X
step2.X++
step3.将X的内容存储回i
2)同步和锁
同步:指在一个线程访问数据未结束时,其他线程不得对同一个数据进行访问。对数据的访问被原子化了。
信号量:同一个信号量可以被系统中的一个线程获取之后,由另一个线程释放
互斥量:互斥量则要求哪个线程获取了互斥量,哪个线程就要负责释放这个锁
临界区:临界区的作用范围仅限于本进程,其他进程无法获取该锁
读写锁
条件变量
3)可重入与线程安全
函数重入的情况:
a.多个线程同事执行这个函数
b.函数自身(可能是经过多层调用之后)调用自身
一个函数被称为可重入的,表明该函数被重入之后不会产生任何不良后果。
一个函数要成为可重入的,必须具有如下特点:
a.不适用任何(局部)静态或全局的非const变量
b不返回任何(局部)静态或全局的非const变量的指针
c.仅依赖于调用方提供的参数
d.不依赖任何单个资源的锁(mutex等)
e.不调用任何不可重入的函数
可重入是并发安全的强力保障
4)过度优化
a.编译器为了提高速度,放到寄存器里面
b.编译器为了效率交换毫不相干的两跳相邻的指令
编译器交换后:
可以使用volatile关键字试图阻止过度优化,volatile基本可以做到两件事:
a) 阻止编译器为了提高速度将一个变量缓存到寄存器而不写回
b) 阻止编译器调整操作volatile变量的指令顺序
但是volatile无法阻止CPU动态调度换序
pInst = new T包含三个步骤:
a)分配内存
b)在内存位置上调用构造函数
c)将内存的地址赋值给pInst
其中b)c)可以颠倒,那么另外一个线程对GetInstance的并发调用可能会直接返回尚未构造完成的对象的地址。
可以使用barrier来保证线程安全:
4.5 多线程内部情况
用户态线程和内核线程之间的关系
1)一对一模型
优点:
线程之间的并发是真正的并发
缺点:
由于许多操作系统限制了内核线程的数量,因此一对一线程会让用户的线程数量受到限制
许多操作系统内核线程调度时,上下文切换的开销比较大,导致用户线程的执行效率下降
2)多对一模型
优点:
线程间的切换由用户态代码来进行,切换速度快
在多处理器的系统上有更好的表现
缺点:
其中一个用户线程阻塞,那么所有线程都无法执行
多处器的增多对线程的性能无帮助
3)多对多模型