4.3.1 调度算法的目标
无论是哪一个层次的处理器调度,都由操作系统的调度程序(scheduler)实施,而调度程序所使用的算法称为调度算法(scheduling algorithm),不同类型的操作系统,其调度算法通常不同。
在讨论具体的调度算法之前,首先讨论调度所要达到的总的目标。设计调度程序首先要考虑的是确定策略,然后才是提供机制。一个好的调度算法应该考虑很多因素,其中包括:
(1)资源利用率。使得CPU或其他资源的使用率尽可能高且能够并行工作。
(2)CPU的利用率=CPU有效工作时间/CPU总的运行时间,而CPU总的运行时间为CPU有效工作时间+CPU空闲等待时间。
(3)响应时间。交互式进程从提交一个请求(命令)至接收到响应之间的时间间隔称响应时间。使交互式用户的响应时间尽可能短,或尽快处理实时任务。这是分时操作系统和实时系统衡量调度性能的一个重要指标。
(4)周转时间。批处理用户从作业提交给系统开始,到作业完成为止的时间间隔称为作业周转时间,应使作业周转时间或平均作业周转时间尽可能短。这是批处理系统衡量调度性能的一个重要指标。
(5)吞吐率。使得单位时间内处理的作业数尽可能多。
(6)公平性。确保每个用户每个进程获得合理的CPU份额或其他资源份额,不会出现“饿死”情况。
当然,这些目标本身存在矛盾之处,操作系统在设计时必须根据其类型的不同进行权衡,以达到较好的效果。
(1)批处理系统。批处理系统的调度性能主要考虑系统吞吐率、周转时间和CPU利用率。系统吞吐率是指最大化单位时间的工作量,单位时间的工作量越大,系统吞吐率越高,说明系统调度性能越好;周转时间是指任务提交到结束之间的时间,作业周转时间越短说明系统调度性能越好;保持CPU始终处在繁忙工作状态,CPU利用率越高,系统调度性能越好。
(2)交互式系统。交互式系统的调度性能主要由响应时间和适度性来衡量,越快响应系统需求,满足用户期望说明系统调度性能越好。
(3)实时系统。实时系统的调度性能主要考虑能满足截止时间要求并提供性能可预测性即可。
4.3.2 先来先服务
在所有调度算法中,先来先服务(first come,first served,FCFS)算法是最简单的非抢占式调度算法。它是指按照作业或进程进入系统的先后次序进行调度,先进入系统者先调度;即启动等待时间最长的作业或进程。该算法容易实现,但效率不高。
例如,图4-5列出了A,B,C,D,E五个进程,它们到达系统的时间分别是0,1,2,3,4,要求服务的时间分别是4,3,5,2,4,采用FCFS调度算法,可以计算出各个进程开始执行的时间及各自的完成时间。从每个进程的完成时间中减去其到达时间,即得到其周转时间,进而可以算出每个进程的带权周转时间。
FCFS算法既可用于作业调度,也可用于进程调度。该算法的特点是:①比较有利于长作业(进程),而不利于短作业(进程);②有利于CPU繁忙型作业(进程),而不利于I/O繁忙型作业(进程);③适用于批处理系统,不适于分时操作系统。
图4-5 FCFS调度算法
4.3.3 短作业优先
短作业(进程)优先调度算法SJ(P)F,是指对短作业或短进程优先调度的算法。它们可以分别用于作业调度和进程调度。短作业优先(short job first,SJF)的调度算法是从后备队列中选择一个或若干个估计运行时间最短的作业,将它们调入内存运行。而短进程优先(short process first,SPF)调度算法则是从就绪队列中选出一个估计运行时间最短的进程,将处理机分配给它,使它立即执行并一直执行到完成,或发生某事件而被阻塞放弃处理机时再重新调度。
为了和FCFS调度算法进行比较,仍利用FCFS算法中所使用的实例,并改用SJ(P)F算法重新调度(图4-6),再进行性能分析。由图4-7可以看出,采用SJ(P)F算法后,不论是平均周转时间还是平均带权周转时间,都有较明显的改善,尤其是对短作业D,其周转时间由原来的(用FCFS算法时)11降为3;而平均带权周转时间是从5.5降到1.5。这说明SJF调度算法能有效地降低作业的平均等待时间,提高系统吞吐量。
但是,SJ(P)F调度算法也存在不容忽视的缺点:
(1)该算法对长作业不利,如作业C的周转时间由10增至16,其带权周转时间由2增至3.1。更严重的是,如果有一长作业(进程)进入系统的后备队列(就绪队列),由于调度程序总是优先调度那些(即使是后进来的)短作业(进程),将导致长作业(进程)长期不被调度。
图4-6 SJ(P)F调度算法
图4-7 图FCFS和SJF调度算法的性能
(2)该算法完全未考虑作业的紧迫程度,因而不能保证紧迫性作业(进程)会被及时处理。
(3)由于作业(进程)的长短只是根据用户所提供的估计执行时间而定,而用户又可能会有意或无意地缩短其作业的估计运行时间,致使该算法不一定能真正做到短作业优先调度。
4.3.4 高优先权优先
1.优先权调度算法的类型
为了照顾紧迫型作业,使之在进入系统后便获得优先处理,引入了最高优先权优先(first priority first,FPF)调度算法。此算法常被用于批处理系统中,作为作业调度算法,也作为多种操作系统中的进程调度算法,还可用于实时系统中。当把该算法用于作业调度时,系统将从后备队列中选择若干个优先权最高的作业装入内存。当用于进程调度时,该算法是把处理机分配给就绪队列中优先权最高的进程,这时,又可进一步把该算法分成以下两种:
(1)非抢占式优先权调度算法。在这种方式下,系统一旦把处理机分配给就绪队列中优先权最高的进程后,该进程便一直执行下去,直至完成;或因发生某事件使该进程放弃处理机时,系统方可再将处理机重新分配给另一优先权最高的进程。这种调度算法主要用于批处理系统中,也可用于某些对实时性要求不严的实时系统中。
(2)抢占式优先权调度算法。在这种方式下,系统同样是把处理机分配给优先权最高的进程,使之执行。但在其执行期间,只要又出现了另一个优先权更高的进程,进程调度程序就立即停止当前进程(原优先权最高的进程)的执行,重新将处理机分配给新到的优先权最高的进程。因此,在采用这种调度算法时,是每当系统中出现一个新的就绪进程i时,就将其优先权Pi与正在执行的进程j的优先权P j进行比较。如果Pi≤Pj,原进程Pj便继续执行;但如果是Pi>Pj,则立即停止Pj的执行,做进程切换,使i进程投入执行。显然,这种抢占式的优先权调度算法能更好地满足紧迫作业的要求,故而常用于要求比较严格的实时系统中,以及对性能要求较高的批处理和分时操作系统中。
2.优先权的类型
对于最高优先权优先调度算法,其关键在于:它是使用静态优先权,还是用动态优先权,以及如何确定进程的优先权。
1)静态优先权
静态优先权是在创建进程时确定的,且在进程的整个运行期间保持不变。一般地,优先权是利用某一范围内的一个整数来表示的,例如,0~7或0~255中的某一整数,又把该整数称为优先数,只是具体用法各异:有的系统用“0”表示最高优先权,数值越大,其优先权越低;而有的系统恰恰相反。(www.xing528.com)
确定进程优先权的依据有以下三个方面:
(1)进程类型。通常,系统进程(如接收进程、对换进程、磁盘I/O进程)的优先权高于一般用户进程的优先权。
(2)进程对资源的需求。如进程的估计执行时间及内存需要量的多少,对这些要求少的进程应赋予较高的优先权。
(3)用户要求。这是由用户进程的紧迫程度及用户所付费用的多少来确定优先权的。静态优先权法简单易行,系统开销小,但不够精确,很可能出现优先权低的作业(进程)长期没有被调度的情况。因此,仅在要求不高的系统中才使用静态优先权。
2)动态优先权
动态优先权是指在创建进程时所赋予的优先权,是可以随进程的推进或随其等待时间的增加而改变的,以便获得更好的调度性能。例如,可以规定,在就绪队列中的进程,随其等待时间的增长,其优先权以速率a提高。若所有的进程都具有相同的优先权初值,则显然是最先进入就绪队列的进程将因其动态优先权变得最高而优先获得处理机,此即FCFS算法。若所有的就绪进程具有各不相同的优先权初值,那么对于优先权初值低的进程,在等待了足够的时间后,其优先权便可能升为最高,从而可以获得处理机。当采用抢占式优先权调度算法时,如果再规定当前进程的优先权以速率b下降,则可防止一个长作业长期地垄断处理机。
4.3.5 高响应比优先调度算法
在批处理系统中,短作业优先算法是一种比较好的算法,其主要的不足之处是长作业的运行得不到保证。如果能为每个作业引入前面所述的动态优先权,并使作业的优先级随着等待时间的增加而以速率a提高,则长作业在等待一定的时间后,必然有机会分配到处理机。该优先权的变化规律可描述为
由于等待时间与服务时间之和就是系统对该作业的响应时间,故该优先权又相当于响应比R P。据此,又可表示为
由上式可以看出:
(1)如果作业的等待时间相同,则要求服务的时间越短,其优先权越高,因而该算法有利于短作业。
(2)当要求服务的时间相同时,作业的优先权决定于其等待时间,等待时间越长,其优先权越高,因而它实现的是先来先服务。
(3)对于长作业,作业的优先级可以随等待时间的增加而提高,当其等待时间足够长时,其优先级便可升到很高,从而也可获得处理机。
因此,高响应比优先调度算法总是优先启动响应比最高的作业,是FCFS和SJF的结合,它克服了两种算法的缺点。该算法既照顾了短作业,又考虑了作业到达的先后次序,不会使长作业长期得不到服务。因此,该算法实现了一种较好的折中。当然,在利用该算法时,每要进行调度之前,都须先做响应比的计算,这会增加系统开销。
4.3.6 基于时间片轮转
如前所述,在分时操作系统中,为保证能及时响应用户的请求,必须采用基于时间片的轮转式进程调度算法。在早期,分时操作系统中采用的是简单的时间片轮转法;20世纪90年代后,广泛采用多级反馈队列调度算法。
1.基本原理
在早期的时间片轮转法中,系统将所有的就绪进程按先来先服务的原则排成一个队列,每次调度时,把CPU分配给队首进程,并令其执行一个时间片。时间片的大小从几毫秒到几百毫秒。当执行的时间片用完时,由一个计时器发出时钟中断请求,调度程序便据此信号来停止该进程的执行,并将它送往就绪队列的末尾;然后再把处理机分配给就绪队列中新的队首进程,同时也让它执行一个时间片。这样就可以保证就绪队列中的所有进程在一给定的时间内均能获得一时间片的处理机执行时间。换而言之,系统能在给定的时间内响应所有用户的请求。
2.时间片大小的确定
在时间片轮转法中,时间片的大小对系统性能有很大的影响,如选择很小的时间片将有利于短作业,因为它能较快地完成,但会频繁地发生中断、进程上下文的切换,从而增加系统的开销;反之,如选择太长的时间片,使得每个进程都能在一个时间片内完成,时间片轮转算法便退化为FCFS算法,无法满足交互式用户的需求。一个较为可取的大小是时间片略大于一次典型的交互所需要的时间。这样可使大多数进程在一个时间片内完成。图4-8示出了时间片分别为q=1和q=4时,A,B,C,D,E五个进程的运行情况,而图4-9为q=1和q=4时各进程的平均周转时间和带权平均周转时间。图中的RR表示轮转调度(round robin)算法。
图4-8 q=1和q=4时的进程运行情况
图4-9 q=1和q=4时进程的周转时间
4.3.7 多级反馈队列调度
前面介绍的各种用作进程调度的算法都有一定的局限性。如短进程优先的调度算法,仅照顾了短进程而忽略了长进程,而且如果并未指明进程的长度,则短进程优先和基于进程长度的抢占式调度算法都将无法使用。而多级反馈队列调度算法则不必事先知道各种进程所需的执行时间,而且还可以满足各种类型进程的需要,因而它是目前公认的一种较好的进程调度算法。在采用多级反馈队列调度算法的系统中,调度算法的实施过程如下:
(1)应设置多个就绪队列,并为各个队列赋予不同的优先级。第1队列的优先级最高,第2队列次之,其余各队列的优先权逐个降低。该算法赋予各个队列中进程执行时间片的大小也各不相同,在优先权越高的队列中,为每个进程所规定的执行时间片就越小。例如,第2队列的时间片要比第1队列的时间片长一倍,……,第i+1队列的时间片要比第i队列的时间片长一倍。图4-10所示是多级反馈队列调度算法的示意。
(2)当一个新进程进入内存后,首先将它放入第1队列的末尾,按FCFS原则排队等待调度。当轮到该进程执行时,如它能在该时间片内完成,便可准备撤离系统;如果它在一个时间片结束时尚未完成,调度程序便将该进程转入第2队列的末尾,再同样地按FCFS原则等待调度执行;如果它在第2队列中运行一个时间片后仍未完成,再依次将它放入第三队列,如此下去,当一个长作业(进程)从第1队列依次降到第n队列后,在第n队列中便采取按时间片轮转的方式运行。
(3)仅当第1队列空闲时,调度程序才调度第2队列中的进程运行;仅当第1~第i-1队列均空时,才会调度第i队列中的进程运行。如果处理机正在第i队列中为某进程服务时,又有新进程进入优先权较高的队列(第1~第i-1中的任何一个队列),则此时新进程将抢占正在运行进程的处理机,即由调度程序把正在运行的进程放回第i队列的末尾,把处理机分配给新到的高优先权进程。
图4-10 多级反馈队列调度算法
多级反馈队列调度算法具有较好的性能,能很好地满足各种类型用户的需要。
(1)终端型作业用户。由于终端型作业用户所提交的作业大多属于交互型作业,作业通常较小,系统只要能使这些作业(进程)在第1队列所规定的时间片内完成,便可使终端型作业用户都感到满意。
(2)短批处理作业用户。对于很短的批处理型作业,开始时像终端型作业一样,如果仅在第1队列中执行一个时间片即可完成,便可获得与终端型作业一样的响应时间。对于稍长的作业,通常也只需在第2队列和第3队列各执行一个时间片即可完成,其周转时间仍然较短。
(3)长批处理作业用户。对于长作业,它将依次在第1,2,…,n个队列中运行,然后再按轮转方式运行,用户不必担心其作业长期得不到处理。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。