首页 理论教育 提高系统利用率的有效措施

提高系统利用率的有效措施

时间:2026-01-22 理论教育 景枫 版权反馈
【摘要】:集散控制系统提高利用率的措施归纳起来有三个方面:提高元器件和设备的可靠性;采用抗干扰措施,提高系统对环境的适应能力;采用可靠性技术。集散控制系统中的控制单元或接口单元,有时甚至是操作站也要置于现场,因此必须要采取严格的抗干扰措施,防止电磁耦合、空间传输或导线传输引入干扰信号。集散控制系统中操作站常采用2~3台共用的冗余措施,各操作站独立工作,互为后备,一个操作站的信息,可向其他站传递。

A的定义式可以看出,要提高利用率就需要增加平均故障间隔时间(MTBF)和减少平均故障修复时间(MTTR)。这涉及好多技术领域,如产品的制造工艺、元器件质量、系统设计方案的优劣、使用人员水平、维护条件的好坏和维修人员的技术水平等,所有这些条件又都受经济指标的约束,需要综合考虑。集散控制系统提高利用率的措施归纳起来有三个方面:提高元器件和设备的可靠性;采用抗干扰措施,提高系统对环境的适应能力;采用可靠性技术。

1.提高元器件和设备的可靠性

硬件质量的好坏是系统可靠与否的基础,必须加强对硬件的质量管理

1)建立严格的可靠性标准,优选元器件,建立元器件的性能老化模型,有效地筛选元器件,消除元器件早期失效对系统可靠性的影响。

2)研究元器件失效的机制,并制定有效措施,规定合理的使用条件。

3)提高组件的制造工艺水平,强化检验措施,把由组件制造工艺引起的故障降到10-9~5×10-9

集散控制系统组件一般要经过目测检查、高温老化、冷热缩胀循环试验。元器件在0~125℃间反复循环10次,每次持续15min,间隔30s;对塑料封装的元器件要在25℃~100℃间做交替试验,最后进行交流参数测试。如此严格的预处理,一方面是择优与筛选,更重要的是使元器件的初期失效特性事先在实验室中暴露,从而在正式投入运行时已进到失效率低且恒定的偶然失效期,提高了组件的MTBF。

另外集散控制系统的维修已进到板级更换的水平,所以对插卡的质量检查特别严格,大多由计算机控制的流水线进行操作,并由特殊的测试设备予以全面测试。

有些集散控制系统更进一步采用表面安装技术,避免了线路焊接和印制板打孔引起的接触不良现象的发生,组件采用全密封真空封装技术,提高了抗恶劣环境的能力。

2.提高系统对环境的适应能力

提高系统的环境适应能力,也是提高集散控制系统可靠性的一个重要方面。集散控制系统中的控制单元或接口单元,有时甚至是操作站也要置于现场,因此必须要采取严格的抗干扰措施,防止电磁耦合、空间传输或导线传输引入干扰信号。

电磁干扰的形式主要有电源噪声、输入线引入的噪声和静电噪声。对电源引进的干扰通常采用电源低通滤波器,通过电感、电容组成的吸收装置抑制电源噪声。在电源进线端加装浪涌吸收器,可有效防止感应雷电对设备的破坏。供电系统进线应注意尽量用粗线。稳压电源要加静电屏蔽,且与继电器、灯泡、开关等分开供电。与计算机接口的线要用双绞线,扭绞的绞距要小。地线是侵入噪声的主要渠道,通常应按标准采用汇流排或粗导线接地。当组件之间有电位差时,采用光耦合器件或变压器进行信号的隔离传输,可收到很好的效果。

为确保系统安全,各类装置均有接地系统,例如:防雷接地、信号接地、电源公共端接地、同轴电缆接地、机壳接地、防爆栅安全接地、上位计算机单独接地等。

为了适应不同工业环境的需要,集散控制系统设计了不同形式的机柜,有透气、敞架式,也有密封强制循环式的机柜,使组件与现场的恶劣环境完全隔离。

3.容错技术的应用

容错技术是指当系统出现错误或故障时,仍能正确执行全部程序。容错技术可分成局部容错技术和完全容错技术。前者是从系统中去除有“病”的功能部件,重新组成一个新系统,让原系统降级使用;而后者则是切换前后功能完全相同。当然这两者都是自动进行的,无需人工干预。

要达到容错目标的根本办法是采用冗余技术,就是采用多余的资源来换取系统的可靠性。一般包括硬件冗余技术、软件冗余技术、信息冗余技术和时间冗余技术。

(1)硬件冗余技术

硬件冗余技术就是增加多余的硬件设备,以保证系统可靠地工作。按冗余结构在系统中所处的位置,可分为元件级、装置级和系统级冗余。按冗余结构的形式可分为工作冗余(热备用)、后备冗余(冷备用)和表决系统3种。

1)工作冗余。工作冗余是使若干同样装置并联运行,只有当组成系统的并联装置全部失效时系统才不工作。设由可靠度为0.90的两台装置组成并联系统,按并联系统的可靠度计算公式

Rp=1-(1-R1)(1-R2)=0.99 (6-17)

并联系统的可靠度的时间函数式:图示

通过对系统可靠度Rpt)由0到∞积分,求得该并联系统的平均故障间隔时间:

图示

λ1=λ2=λ,故图示

由此可见,两个装置组成的并联系统与单装置相比,平均故障间隔时间是原来的1.5倍。集散控制系统中操作站常采用2~3台共用的冗余措施,各操作站独立工作,互为后备,一个操作站的信息,可向其他站传递。

2)后备冗余。后备冗余是指仅在主设备故障时才投入工作的储备,它可以采取一用一备的方式,即为1∶1后备冗余,也可以是多用一备的方式,即n∶1后备冗余。假定备用单元不工作时失效为零,从理论上说,后备冗余的系统连续工作时间可无限长。在1∶1备用系统中,若各单元的可靠度为Ri=e-λt,则备用系统可靠度为

Rbt)=e-λt(1+λt) (6-19)

单台设备的有效度为

图示

n台设备有一台后备的有效度,可用马尔可夫过程状态转移矩阵求解

图示

随着微型计算机技术的发展,硬件价格不断下降,集散控制系统中大多采用1∶1后备冗余。

3)表决系统。表决系统由若干个工作单元和一个表决器组成,每个工作单元的信息输入表决器,只有当有效的单元数超过失效的单元数时,才能作出输入为正确的判断,也即失效部件数小于有效部件数时,系统才正常工作。

对于3取2的表决系统,当各子系统失效率皆为λ,其可靠度为

图示

(2)冗余系统的选择

系统硬件可靠性设计一般采用以下方法:

1)根据系统元器件的失效率,计算系统的可靠度,同时考虑经济性、可维护性、操作性等,以确定最佳方案。(https://www.xing528.com)

2)在元器件可靠度不符合要求时,实行降额使用,即让元器件工作在规定的环境条件及负载条件1/2或以下的数值,以降低使用要求来换取可靠性的提高。

3)当单个元器件达不到要求的可靠度时,应考虑采用冗余结构。图6-2给出了几种冗余系统可靠度的比较。设单元的可靠度均为单个设备的可靠度,曲线2为两设备并联时的可靠度,曲线3为1∶1后备冗余的可靠度,曲线4为3取2表决系统的可靠度。

单个设备的可靠度Ri=e-λt,两并联设备的可靠度R=2e-λt-e-2λt,1∶1后备冗余的可靠度Ri=e-λt(1+λt),3取2表决系统的可靠度R=3e-2λt-2e-3λt。由图6-2可见,备用系统可靠度<并联系统可靠度<单个设备可靠度。3取2表决系统在t<1.44时,可靠度较单个设备高,一旦超过此值,其可靠度还不如单个设备。随着时间的推移,可靠呈下降趋势。t<1时,可靠度急剧下降,这说明冗余系统在短时期内工作,能显著提高系统的可靠性。

图示

图6-2 几种冗余系统可靠度比较

(3)信息冗余技术

信息冗余技术是利用增加的多余信息位提供检错甚至纠错的能力。增加多余的信息位后,能实现检错还是纠错,主要取决于出错后的数据相对于原数据怎样分布,如果原数据的出错码相互之间并不重复,则能根据出错数据判定原数据是什么,因此能纠错,这样的代码称做“纠错码”。另一种情况是原数据的出错码之间互相重复,根据接收的错误码不能判断其发送的原码,这样的代码只能称做检错码。至于某种代码能检错还是纠错,以及能检几重错和纠几重错,由理查德海明所提出的办法能给出某种关系式,此处不作详细介绍,请参阅有关书籍。

(4)检错码实例

在差错控制系统中所采用的检错码种类很多,常用的有奇偶检验码和循环码。

1)奇偶校验码。奇偶校验码是最简单的检错码,它是使代码(包括n位信息位和1位校验位)中含“1”的个数保持奇数或偶数,前者称为奇数校验,后者称为偶数校验。例如:对于信息001100采用奇数校验时代码是0011001,末位校验位是“1”,采用偶数校验时,代码是0011000,末位校验位是“0”。这种简单的奇偶校验,可以发现1位错,但是当代码传输中同时出现偶数个代码错误时,它是无法发现的。

为了提高奇偶校验码的差错检测能力,可以对一个信息组进行奇偶校验编码。将这组代码看做是一个二维代码模式,分别沿横向与纵向进行奇偶校验编码。这种同时具有水平奇偶校验位和垂直奇偶校验位的代码称为二维奇偶校验码,其模式见表6-2,表中采用偶数校验。

表6-2 二维校验模式

图示

显而易见,这种校验码可以发现全部字符的二重错(即同时出现两个错误),甚至某一字符的完全丢失。

2)循环码。循环码的编码方式有以下两种:

第一种将n位信息的代码多项式Fx)乘以xmm为冗余位的数目)除以某个m次生成多项式Gx)(模2除法),得到的余数Rx)另加在Fx)上,作冗余位一起发送。接收方收到循环码后,用已知的Gx)去除,若不能整除,即表示出错。

例如:数据110101,写成代码多项式Fx)=x5+x4+x2+1,并设Gx)=x2+1,即(102)2,则按Fxx2/Gx)=(x7+x6+x4+x2/x2+1)=(x5+x4+x3+x+1)图示x+1),即余数为11。因此所得循环码是11010111,接收方将它除以101,如能整除即判为正确信息。TDC-3000 BASIC中的31位HW字,其中最后5位BCH码就是循环检错码。

第二种是发送Fx)与Gx)的乘积。这样接收方只需判断所得代码是否能被Gx)整除,若不能就是出错。而且所得的商就是信息位。对上例,发送的代码多项式为(x5+x4+x2+x+1)(x2+1)=x7+x6+x5+1,即所得的循环码是11100001。

循环码的检错能力与选择的生成多项式Gx)有关,所进行的除法是模2除法。

(5)时间冗余技术

通过消耗时间资源达到容错的目的。这种错误都带有瞬时性和偶然性,过一段时间可能不再出现。

1)指令复执方法。当计算机出错后,让当前指令重复执行。若不是永久性故障,可能不会再出现,程序可顺利地执行下去。它的基本要求是出错后保留现行指令地址,以备重新执行,执行一次后不自动往下继续执行,待预定的复执次数或复执时间到达后才往下继续执行新的程序,若复执完毕仍然处于故障状态,则复执失败。

2)程序卷回方法。程序卷回方法不是只对一条指令的重复执行,而是针对一小段程序重复执行。重复执行成功,则继续往前执行,重复执行失败,可以再卷回若干次。时间监视由定时计数器来完成,程序正常后自动停止计时。

3)冗余传送方式又分为以下3种方式:

①返送方式。当接收到正确无误的全部消息后,接收设备将发出一个回波,如果发信端得不到正确的响应,说明对方接收的是错误信息。当然这种冗余传送方式的前提应该是信号通道的高可靠性,否则信息正确而返回信道有误也要出现差错。

②连发方式。发送端对同一信息发送两次,接收端进行比较,有不一致即说明“有错”。这种传送一个信息要发两次,效率极低,为提高效率也有改成先等待双方的应答脉冲,若收不到,再连发。

③返送校验信息方式。接收端根据收到的信息编制成校验信息,再返回到发送端,与发送端保存的校验信息进行比较,如发现有错,则加上重发标记再发一次。

(6)全系统的多级操作控制

集散控制系统除了横向的分散控制、分散显示、分散数据库外,还具有纵向的分级控制特性,使得上位机、操作站、控制器甚至手操单元,都可直接控制现场执行机构,实现了纵向冗余。只要最低一级的控制功能不消失,系统仍能工作,所以多级控制系统的可靠性是十分高的,据资料介绍,多级控制系统的有效度可达99.999903%,而子系统的最高有效度仅99.99643%。

(7)自诊断技术

要缩短系统的平均故障修复时间,延长平均故障间隔时间,一个有效的措施就是采用自诊断技术,包括离线诊断和在线诊断。离线诊断一般在系统投运之前全面地测试集散控制系统的性能,为开车做好准备,这时有专门的诊断软件提供用户调试。投运以后就进入在线诊断,一般分设备级和卡级自诊断。例如:控制器每个工作周期对自身检查一遍,如发现差错,立即在CRT上告知用户,以便及时进行处理。常用的自检方法有方格图形法、指令代码求和法、程序时间监视法等。

1)RAM的自检。方格图形法常用于对空白RAM的检测,预编制好一个程序,先向RAM写入检查字,然后再读出,比较前后两次结果,即可判断RAM的工作是否正常。若有差错,则指示出错,并给出出错的地址号。测试用的检查字常为AAH和55H,A的代码是1010,5的代码是0101,很像黑白相间的方格,故称为方格图形。AAH和55H互为反码,循环一遍,即可检查RAM各位读写“1”和“0”的能力。

当程序投运之后,作为数据区的RAM已存放有一定的信息,检查程序绝对不能破坏原来存入的内容,因此方格图形法已不再适用,通常采用“异或”的方法进行检查。先从被检查的RAM单元中读出信息,求反后再与原单元的内容进行“异或”运算,如果结果为全“1”,则表明该RAM工作正常,否则应给出出错信息,并指示出错地址。

2)ROM的自检。ROM中存放着系统工作的程序、各类常数及表格等信息,它的内容决定了系统的工作。常用指令代码求和的方法对ROM进行检查,即将指令代码逐条进行“异或”运算,并把最终的检验“和”写入程序的最后一个单元,对ROM自检时只要把“异或”的结果与标准的检验“和”相比较,两者不同,则说明ROM的内容有问题。

3)传送信息的自检。除了前面提到的采用信息冗余、传送冗余的方法以外,对系统中信息还进行多种检测。

①传输波形检错。对通信字的每一位进行波形检查,看其是否包含规定的正、负脉冲,如果有错,将拒绝接收。

②位计数检错。检查每个通信字的位数,计少了就显示出错。

③基准位检错。检查每个通信字的基准位是否符合规定的要求,例如:为“0”或“1”,假如不符,则认为出错。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈