首页 理论教育 HPC集群机房建设与管理:可用性参数计算

HPC集群机房建设与管理:可用性参数计算

时间:2023-11-23 理论教育 版权反馈
【摘要】:系统可用性可分别用平均故障间隔时间和平均维修时间表示:将MTBF=1/λ、MTTR=1/μ代入上式,可得到可用度(性)的计算公式:

HPC集群机房建设与管理:可用性参数计算

任何设备和系统都不是完全可靠的,系统出现失效的原因很复杂,包括产品设计、生产质量、运行环境和操作因素,也有系统配置的合理性和可维护性等因素,从设备和系统的有效使用功能看,更要关注系统设计和可维护性。

MTBF、MTTR、可用度A(t)等是系统可用性(可用度)的主要衡量指标。2.2.4.1平均无故障时间MTBF计算根据MTBF定义,

由上式,MTBF在数量上等于可靠性曲线和坐标轴所限定的面积。将R(t)=e-λt

带人上式,得到:

上述可靠性R(t)可改写为:

当工作时间t<<MTBF,则公式可近似为:

对于一批N台设备,彼此没有关联性,则MTBF为:

式中,ti为第i个系统的无故障工作时间(h);N为设备数量。

工程上,同一台整机在试验时,总试验时间为T,出现了n次故障。故障后进行修复,然后再进行试验(修复时间不包括在总试验时间T内),则:

MTBF=T/n

MTBF数值越大,表示该设备可靠性越高。

2.2.4.2 平均维修时间MTTR和修复率计算(www.xing528.com)

设备和系统是否可维修,以及维修时间对可用性至关重要。在产品设计定型过程中,把设备的可维修性作为一个重要的因素考虑。

平均维修时间(Mean Time to Repair,MTTR)定义为:系统在故障修复过程中,每次修复时间的平均值,即

式中,ti为第i次的修复时间(h);N为修复次数。

因为无论设备如何可靠,都永远存在故障和维修时间,所以MTTR总是越小越好,大型重要系统都设计不停机维修系统,实现MTTR为最小,乃至为0。

修复率:修复率反映修复的速度,时刻t的可维护性就是假定部件在时刻0时发生故障的情况下,到时刻t时完成修复的概率,用表示。

若定义的0~t是1h,MTTR为2h,则μ=0.5。

若MTTR为0.5h,则μ=2。

2.2.4.3 可用性A(t)与故障率和修复率关系

可用性(可用度)A(t)定义为:系统在使用过程中(尤其在不间断连续使用的条件下),可以正常使用的时间与总时间之比。

系统可用性可分别用平均故障间隔时间(MTBF)和平均维修时间(MTTR)表示:

将MTBF=1/λ、MTTR=1/μ代入上式,可得到可用度(性)的计算公式:

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈