首页 理论教育 分布式计算机控制系统的系统可靠性

分布式计算机控制系统的系统可靠性

时间:2023-10-19 理论教育 版权反馈
【摘要】:DCS 的可靠性是评估DCS 的一个重要性能指标。提高DCS 的可靠性最为适用的措施就是可靠性设计。要想提高集散控制系统的整体可靠性,进行可靠性设计,需要分别考虑如何提高其硬件和软件的可靠性。设计冗余结构的范围应与系统的可靠性要求、自动化水平、经济性一起考虑。接插卡件在DCS 组成中所占的比例较大,其可靠性会直接影响全系统的正常运行。对元器件要进行严格的预处理和筛选,按照可靠性标准来检查全部元器件。

分布式计算机控制系统的系统可靠性

可靠性是指系统在规定的条件下、规定的时间段内完成规定功能的能力。可靠性工程是指为了保证产品在设计生产及使用过程中达到预定的可靠性指标应该采取的技术及组织管理措施,通常采用可靠度、MTBF、MTTF、故障率来衡量可靠性。

(1)可靠度(Reliability): 是指机器零件、系统从开始工作起,在规定的适用条件下的工作周期内达到所规定的性能,即无故障正常状态的概率。

(2)MTBF (Mean Time Between Failures): MTBF 即平均无故障时间,是指可以边修理边使用的机器、零件、系统在相邻故障期间的正常工作时间的平均值。

(3)MTTF (Mean Time To Failures): MTTF 即发生故障的平均时间,是指不能修理的机器、零件、系统从工作至发生故障为止的工作时间的平均值,即不可修理产品的平均寿命。

(4)故障率(Failures Rate): 通常指瞬时故障率。瞬时故障率是指能工作到某个时间的机器零件、系统在连续单位时间内发生故障的比例,又称失效率、风险率。

DCS 的可靠性是评估DCS 的一个重要性能指标。通常,制造厂商提供的可靠度数据都是99.99%。由于可靠性指标具有统计特性,因此在评估系统可靠性时,可以采用那些提高系统可靠性的措施来分析。

提高DCS 的可靠性最为适用的措施就是可靠性设计。日本横河公司对DCS 的可靠性设计提出了以下3 个准则

(1)系统运行不受故障影响的准则。这条准则包括两方面内容: 一方面是冗余设计,可以使系统某一部件发生故障时能自动切换;另一方面是多级操作,可以使系统某一部件发生故障时能够旁路(或降级)使用。

(2)系统不易发生故障的准则。这是非常重要的可靠性设计准则,就是要从系统的基本部件着手,提高系统的MTBF。

(3)迅速排除故障的准则。这是一条很重要的维修性设计准则,包括故障诊断、系统运行状态监视、部件更换等设计,用于缩短系统的MTTR。

要想提高集散控制系统的整体可靠性,进行可靠性设计,需要分别考虑如何提高其硬件和软件的可靠性。

1.提高DCS 硬件可靠性

1)冗余结构设计

冗余结构设计可以保证系统运行时不受故障的影响。按照冗余部件、装置、系统的工作状态,冗余可分为工作冗余和后备冗余;按照冗余度的不同,冗余可分为双重化冗余和多重化冗余。

设计冗余结构的范围应与系统的可靠性要求、自动化水平、经济性一起考虑。为了便于多级操作,实现分散控制、集中管理的目标,在进行冗余设计时,越是处于下层的部件、装置、系统,就越需要冗余,且冗余度越高。

DCS 冗余设计一般需要考虑供电系统的冗余、过程控制装置的冗余、通信系统的冗余、操作站的冗余。

(1)供电系统的冗余。

从系统外部供电时,采用双重化供电冗余是最常用的方法。冗余电源既可以是另一路交流供电电源,也可以是干电池蓄电池不间断电源。在DCS 中,为了保证即使发生供电故障,系统数据也不会丢失,还要对RAM 采用镉镍电池供电。对于自动化水平较高的大型集散控制系统的冗余供电系统,也可采用多级并联供电。

(2)过程控制装置的冗余。

这一部分可分为装置冗余和CPU 插板冗余。装置冗余通常用多重化(n ∶1)冗余方式,典型的n 值可为8 ~12,通过控制器指挥仪来协调。CPU 插板冗余通常为多重化冗余,采用热后备方式。

(3)通信系统的冗余。

几乎所有DCS 都采用双重化的通信系统的冗余拓扑结构。根据网络的不同,过程控制装置和操作站之间的数据通信可以是总线式或环形拓扑结构。操作站和上位机之间也存在数据通信。各站间和其他装置通过网间连接器或适配器进行数据通信。在DCS 中存在数据通信的部位几乎无一例外地采用了冗余结构。

(4)操作站的冗余。(www.xing528.com)

操作站冗余常采用2 ~3 台操作站并联运行,组成双重化冗余或(2,3)表决系统冗余。各操作站通常可以调用工艺过程的全部画面和数据信息,有些系统采用各操作站分管工艺过程的一部分信息,一旦某台操作站发生故障,就把该分管部分分配给工作的操作站进行操作。

另外,对于DCS 输入/输出信号的插卡部件、上位机,也可以组成冗余结构。冗余设计以投入相同的装置、部件为代价来提高系统可靠性。在实际设计选型时,应该根据工艺过程和特点、自动化水平、系统可靠性要求,提出合理的冗余要求。同时,还要进行经济分析和经济指标考虑。

2)不易发生故障的硬件设计

一般来说,为提高系统使用寿命,可从以下几方面考虑硬件设计和系统选型。

(1)考虑运动部件。由于机械运动部件的使用寿命要比电子元器件的使用寿命短,因此系统中使用的运动部件的寿命就成为衡量系统可靠性的指标。

(2)接插卡件在DCS 组成中所占的比例较大,其可靠性会直接影响全系统的正常运行。接插卡件的可靠性设计包括卡件本身的设计、卡件与卡件座的接触部件的设计。DCS中的接插卡件是在计算机控制的自动流水线上生产的,采用波峰焊接、多层印刷版、镀金处理等先进的制造工艺、可靠性测试和检验,从而提高了接插卡件的可靠性。

(3)对元器件(包括机械和电子元器件)都应选用高性能、规格化、系列化的元器件。例如,大规模集成电路超大规模集成电路、微处理器芯片、耐磨损传动器件等。对元器件要进行严格的预处理和筛选,按照可靠性标准来检查全部元器件。

另外,还需采用电路优化设计方法,采用大规模和超大规模的集成电路芯片、尽可能减少焊接点、将连接线优化布置、选用优化性能的元器件等,这不但能够提高系统的可靠性、防止和降低干扰的影响,而且能降低成本、提高竞争能力。电路优化设计还包括使集散控制系统具有多级控制系统的总体设计,这种总体设计可以使系统在发生局部故障时能够降级控制,直到手动控制。这类总体设计属于结构优化设计,也属于电路优化设计的一部分。

3)迅速排除故障的硬件设计

为了能够迅速排除故障、减少MTTR,除了需要具有足够的备品备件、不断提高维修人员技能以外,还需对DCS 采用以下硬件设计方法。

(1)自诊断设计。

DCS 的自诊断硬件设计,是使系统能够在发生故障时使标志位发生变化,并激励相应故障显示灯亮;DCS 的自诊断软件设计,是能够将检测值与故障限值进行比较,并依据比较结果发出信号。

(2)实用的硬件措施设计。

这种设计主要是针对需要经常检修、更换的部件所采用的硬件设计措施,以及保证部件不易发生故障的硬件设计措施。这种硬件设计措施包括机械部件的设计、电子线路的设计,对于需要经常检修和更换的部件,需要采用接插卡件的机械设计

2.提高DCS 的软件可靠性

1)分散结构软件设计

分散结构软件设计是指将整体的软件结构分散成各子系统的设计,子系统各自独立、共享资源。这种分散结构的软件设计既有利于设计工作的开展,也有利于软件工作的调试。例如,把整体设计分为控制器模块、历史数据模块、打印模块、报警模块、事件模块等子系统的软件设计。

2)软件容错技术设计

软件设计中的容错技术是指对误操作不予响应的软件设计。不予响应是指对于操作人员的误操作(如操作人员没有按照设计顺序操作时),软件不会按照这项操作去输出相应的操作指令,有的软件会根据误操作类别输出有关的操作出错的信息。

3)采用标准化软件

采用标准化软件可以提高软件运行的可靠性,避免许多软件运行问题。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈