6.用户层的I/O软件
小部分I/O系统软件放在了用户应用层上。
库函数(与应用程序链接)
假脱机技术(虚拟设备)
1)系统调用与库函数
不允许运行在用户态的应用进程,去直接调用运行在核心态(系统态)的OS过程。
应用进程在运行时,又必须取得OS所提供的服务。
于是:
OS在用户层中引入了系统调用,应用程序可以通过它,间接调用OS中的I/O过程,对I/O设备进行操作。
2)设备分配中的虚拟技术� —— SPOOLing技术
虚拟性是OS的四大特征之一。
多道程序技术将一台物理CPU虚拟为多台逻辑CPU,实现多个用户共享一台主机;
如何将一台物理I/O设备虚拟为多台逻辑I/O设备,允许多个用户共享“同时使用” ?
假脱机技术
多道程序技术,专门利用程序模拟脱机I/O的外围机,完成设备I/O操作。
称这种联机情况下实现的同时外围操作为SPOOLing 技术(Simultaneaus Periphernal Operating On—Line,或称为假脱机操作)
一般进程对独占设备的需求被假脱机模拟到磁盘上。所以实现设备虚拟,多道是前提,还需高速、大容量、可随机存取的外存支持。
SPOOLing系统的组成
主要有三大部分(如下页图)
输入井和输出井:磁盘上开辟两大存储空间。输入井模拟脱机输入的磁盘设备,输出井模拟脱机输出时的磁盘。
输入缓冲区和输出缓冲区:为缓解速度矛盾,内存中开辟两大缓冲空间,输入缓冲区暂存输入设备送来的数据,再送给输入井;输出缓冲区暂存输出井送来的数据,再送输出设备。
输入进程和输出进程。
用一进程模拟脱机输入时外围设备控制器的功能,把低速输入设备上的数据传送到高速磁盘上;
用另一进程模拟脱机输出时外围设备控制器的功能,把数据从磁盘上传送到低速输出设备上。
SPOOLing技术的使用:
当用户进程请求打印输出时,SPOOLing系统同意为它打印输出,但并不真正立即把打印机分配给用户进程,而只为它做两件事:
①由输出进程在输出井中为之请求一个空闲磁盘块区,并将要打印的数据送入其中.
②输出进程再为用户进程申请一张空白的用户请求打印表,并将用户的打印要求填入其中,再将该表挂在请求打印队列上.
打印输出过程:
如果打印机空闲,输出进程将从请求打印队列的队首取出一张请求打印表,根据表中的要求将要打印的数据,从输出井传送到输出缓冲区,再由打印机进行打印.
打印完毕后,输出进程再查看请求打印队列中是否还有等待打印的请求表,如此下去,直至请求打印队列为空,输出进程才将自己阻塞起来.
仅当下次再由打印请求时,输出进程才被唤醒.
守护进程
守护进程(Daemon)是运行在后台 的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。
Linux的大多数服务器就是用守护进程实现的。比如,Internet服务器inetd,Web服务器httpd等。同时,守护进程完成许多系统任务。比如,作业规划进程crond,打印进程lpd等。
利用守护进程实现打印机
①为打印机建立一个守护进程,由它执行一部分原来由假脱机管理进程功能的功能。
②由请求进程生成一份要求打印的文件,并将用户请求打印文件放入假脱机文件队列(目录)中。
共享打印机
打印机属于独占设备,利用SPOOLing技术可将其改造为一台可供多个用户共享的设备。
见课本说明:
核心就是不能交叉打印的数据,虚拟的打印在磁盘的输出井上(而磁盘的非独占性解决了打印机不能方便共享的问题)。
有打印输出请求的进程申请“请求打印表”。
数据虚拟打印到“输出井”
Spooling程序再按“请求表队列”分配真正的打印机打印数据。
SPOOLing系统的特点
提高了I/O的速度。利用输入输出井模拟成脱机输入输出,缓和了CPU和I/O设备速度不匹配的矛盾。
将独占设备改造为共享设备。并没有为进程分配设备,而是为进程分配一存储区和建立一张I/O请求表。
最终,实现了虚拟设备功能。多个进程可“同时”使用一台独占设备。
7.缓冲区管理
有”控制器”或”通道”的帮助后CPU可解放去做其他事物,提高了利用率。
但分析单个程序内的执行
CPU计算工作需等待后续数据输入才可继续
CPU计算需等待数据输入完才能计算,虽然数据输入不需CPU干预,但CPU的解放也只是能去做其他程序,需切换工作,会产生开销。
一进程中“CPU计算速度”和“设备I/O速度”仍存在不匹配的矛盾。
解决:CPU进行当前计算时,设备进行后续数据的输入(——缓冲区)。
缓冲管理
I/O控制方式减少CPU对I/O的干预提高利用率;
缓冲则通过缓和CPU和I/O设备速度不匹配矛盾,增加CPU和I/O设备的并行性,提高利用率。
现代OS中,几乎所有的I/O设备与处理机交换数据时,都用了缓冲区。
引入缓冲区的主要原因:
缓和CPU与I/O设备间速度不匹配的矛盾。
缓冲区数据成批传入内存,也可进一步减少对CPU的中断频率
最终目的:提高CPU和I/O设备的并行性。
使用缓冲区的方式:
1)单缓冲、多缓冲
单缓冲(Single Buffer)
每当用户进程发出一I/O请求时,
单位:字符设备输入时,缓冲区用于暂存用户输入/输出的一行数据;块设备输入则是成块数据。
OS在主存中为之分配一个缓冲区。
CPU和外设轮流使用,一方处理完后等待对方处理。
双缓冲(Double Buffer)
进一步加快输入和输出速度,提高设备利用率制,也称缓冲对换(Buffer Swapping)
输入:数据送入第一缓冲区,装满后转向第二缓冲区。
读出:OS从第一缓冲区中移出数据,送入用户进程,再由CPU对数据进行计算。
两个缓冲区,CPU和外设不再针对一块交替
可能实现连续处理无需等待对方。前提是CPU和外设对一块数据的处理速度相近。而如下图情况CPU仍需等待慢速设备。
双缓冲还适合双向通讯
仅配置单缓冲,任意时刻都只能实现单方向的数据传输,而不允许双方同时向对方发送数据。
为实现双向数据传输,需为两台机器中的通讯进程都设置两个缓冲区。定义不同功能:一个用作发送缓冲区,另一个用作接受缓冲区。
多缓冲引入
I/O与CPU速度基本相匹配,采用双缓冲能获得较好的效果,基本上能并行操作。
但,若两者的速度相差甚远,双缓冲的效果仍不够理想;
为进一步协调速度差,可增加缓冲区数量,同时进行一定的多缓冲管理入和出的同步。
引入多缓冲机制。组织形式:循环缓冲、缓冲池。
2)循环缓冲(circular buffer)
设置多块缓冲区
用循环结构组织,只供两个相关进程使用
顺一个方向放入或取出
①循环缓冲的组成
多个缓冲区。大小相同,三种类型:
预备装输入数据的空缓冲区R
装满数据的缓冲区G
计算进程正在使用的现行工作缓冲区C
多个指针。
指示正在使用的缓冲区C的指针Current
指示计算进程下一个可取的缓冲区G的指针Nextg
指示输入进程下次可放的缓冲区R的指针Nexti
②循环缓冲区的使用
计算进程(CPU)和输入进程(I/O操作)可利用两个过程来使用循环缓冲区。
主要就是利用指针,操作上述不同类型缓冲区
Getbuf过程:使用缓冲区时,可调用该过程
计算进程取:current=Nextg,G—>C,nextg下移一个。
输入进程放:current=nexti,R—>C,nexti下移一个
Releasebuf过程:
计算进程:C->R
输入进程:C->G
一个时段只能用于输入或输出,不能同时双向通信。
③进程同步
两个进程的控制:输入进程和计算进程并行执行,如何控制相应的两个指针不断顺时针方向移动,这样就可能出现两种情况:
Nexti赶上Nextg。意味着输入速度大于计算速度,缓冲区满,只能阻塞输入进程等计算进程取,此情况称为系统受计算限制。
Nextg赶上Nexti。意味着输入速度低于计算速度,缓冲区空,只能阻塞计算进程等输入进程放,此情况称为系统受I/O限制。
3)缓冲池(Buffer Pool)
循环缓冲的问题
不能同时双向通讯
利用率不高。缓冲区是专用缓冲。(每个进程都要维护自己的一个循环缓冲区),使用有剩余时也不给其他进程使用,消耗大量内存空间。
系统并发程序很多时,许多这样的循环缓冲需要管理,比较复杂。
为提高缓冲区的利用率,目前广泛流行缓冲池,在池中设置多个可供若干个进程共享的缓冲区。
系统将多个缓冲区形成一个缓冲池。
池中缓冲区为系统中所有的进程共享使用(如UNIX系统在块设备管理中设置了一个15个缓冲区组成的缓冲池)
组织形式:队列及队列指针
①缓冲池的组成
对于既可输入又可输出的公用缓冲池,至少应含有下列三种类型的缓冲区:
空缓冲区;
装满输入数据的缓冲区;
装满输出数据的缓冲区;
为方便管理,将上述类型相同的缓冲区连成队列
空缓冲区队列(所有进程都可用)
输入队列(n个进程有各自的队列)
输出队列(n个进程有各自的队列)
*(队列长度不固定,根据进程实际情况灵活变动,需要多少用多少)
工作状态决定了current有四种工作缓冲区:
状态 操作者
收容输入数据的工作缓冲区;hin
提取输入数据的工作缓冲区;sin
收容输出数据的工作缓冲区;hout
提取输出数据的工作缓冲区;sout
②缓冲区的工作方式
四种工作方式:
收容输入:Getbuf(emq),hin;输入数据填入一空缓冲区;Putbuf(inq,hin)
提取输入: Getbuf(inq),sin;从输入缓冲队列中取出一数据区的内容;Putbuf(emq,sin)
收容输出: Getbuf(emq),hout;输出数据填入一空缓冲区;Putbuf(outq,hout)
提取输出: Getbuf(outq),sout;从输出缓冲队列中取一数据区的内容;Putbuf(emq,sout)
缓冲区的使用
Getbuf(队列,工作区)
Putbuf(队列,工作区)
同步控制
每队设置一个互斥信号量MS;
判断每个队列是否有可用的缓冲区,需一个资源信号量RS。获取缓冲区时P(RS),释放时V(RS)。
缓冲池:可双向缓冲;缓冲区整体利用率高。
8.磁盘存储器的性能和调度
1)磁盘性能简述
首先与格式有关
数据的组织和格式
盘片、面、磁道、扇区
为方便处理,每条磁道存储容量相同,每个磁道上的每个扇区相当于一个盘块。磁盘”格式化”的过程就是按规定的格式规划盘块。
与速度有关
磁盘类型
固定磁头(每道一磁头)
移动磁头(每盘一磁头)
访问时间的计算
寻道时间(到磁道)
旋转延迟(到扇区)
传输时间
传输时间占总时间的比例最小,磁盘读写速度的提高要选择合适的调度算法,减少前两项用时,使所有作业的磁盘处理时间均衡。
2)磁盘调度方法
对所有请求访问磁盘的进程进行合理调度,使对磁盘的平均访问时间最小。
目标:使平均寻道时间最少。
算法:
①FCFS
多个进程的磁盘I/O请求构成一个随机分布的请求队列。
磁盘I/O执行顺序按磁盘请求的先后顺序。
②最短寻道时间优先SSTF�ShortestSeekTimeFirst
选择从当前磁头位置出发移动最少的磁盘I/O请求
使每次磁头移动时间最少。
不一定是最短平均柱面定位时间,但比FIFO算法有更好的性能。
对中间的磁道有利,但可能会有进程处于饥饿状态(I/O请求总不被执行)。
扫描算法SCAN(磁盘电梯调度算法)
③扫描算法SCAN(磁盘电梯调度算法)
SSTF会导致“饥饿”现象
总选择最近的磁道访问,远磁道请求的进程会长时间得不到执行。
改进:
考虑距离的同时,更优先考虑方向
SCAN算法
规定磁头移动方向:自里向外,再自外向里移动。
后续的I/O磁道请求,哪个在规定方向上距离最近,就先执行哪个。
如当前为100,后续要求55,86,95,180,165,105
先由内向外:选最近的105执行,再判断剩余的,选165,180。
再由外向内:95,86,55
反方向较近的55号磁道请求的进程相对“饥饿”很久
循环扫描CSCAN
SCAN的错过问题:
容易错过与当前磁道距离近,但方向不一致的磁道。
修改:将SCAN规定的移动方向改为“单向移动”
由里向外后,再由里向外。
N-Step-SCAN
前述最近寻道算法共同问题:
“磁臂粘着”——磁头静止在一个磁道上,导致其它进程无法及时进行磁盘I/O。(因:高密度盘,进程的读写可能集中在某一磁道)
如现有一系列请求:
3 3 5 2 3 3 3 2 3 3 2 3 3 4 4 5 2 3 3 3 4 4 2 3 3 3 2 2 2 3
不管哪种算法,从3开始向下执行会是
3 3 3 3 3 3 3 3 3 3….2 2 2 2 2 2 … 4 4 ….
改进:
将磁盘请求队列分成长为N 的子队列
按FCFS选择子队列。队列内又按SCAN算法。
3 3 5 2 |3 3 3 2| 3 3 2 3| 3 4 4 5| 2 3 ….2 3
处理子队列过程中产生的新I/O再依次排队列。
N=1时,就是FCFS,N很大时就是SCAN。
F-SCAN
N-Step-SCAN的简化:
请求队列只分为两个子队列
当前一个队列,按SCAN算法执行;
扫描期间新生成的组成一个队列,等待被扫描。