首页 理论教育 HPC集群机房的可靠性模型与管理

HPC集群机房的可靠性模型与管理

时间:2023-11-23 理论教育 版权反馈
【摘要】:对于HPC集群机房基础设施的各子系统的可靠性,建筑结构、供电、空气凋节、综合布线等系统决定了机房的可靠性运行。下面按照国标《电子信息系统机房设计规范》、《数据中心基础设施施工及验收规范》的分级要求,对各个子系统的各个级别相应配置分别进行可靠性模型的分析。220V/380V电网系统可靠性模型如图2-15所示。

HPC集群机房的可靠性模型与管理

对于HPC集群机房基础设施的各子系统的可靠性建筑结构、供电、空气凋节、综合布线等系统决定了机房的可靠性运行。下面按照国标《电子信息系统机房设计规范》(GB50174-2008)、《数据中心基础设施施工及验收规范》(GB 50462-2015)的分级要求,对各个子系统的各个级别相应配置分别进行可靠性模型的分析。

(1)建筑结构子系统的可靠性。

建筑结构子系统可靠性因为涉及建筑及结构的可靠性/可用性,涉及用户使用状况、地质条件与灾害等,属于非常复杂的专题,所以本书不讨论该子系统。

在考虑建筑结构子系统的可靠性/可用性过程中,建议HPC集群机房的设计者、用户按照相关标准、规范,合理地选择数据中心位置,如避免强干扰、地震、爆炸、环境污染等危险,方便的运输条件,进行科学机房分布局等,提高机房建筑结构系统的可靠性/可用性。

(2)供电子系统的可靠性。

供电系统指的是从市电变压器发电机组之后,包括ATS自动切换开关、配电系统、UPS、供电电缆等环节,如图2-13所示。

图2-13 机房常见供电系统图(示意图)

供电系统应由高低压供配电管理系统、UPS供电系统及后备电源系统组成。它们相互之间的配置是否合理决定了整个供电系统的可靠性。科学合理的供电系统,可确保机房长期高效地运行。主要供电子系统和部件的故障率和修复率数据如表2-4所示。

根据表2-4中数据,由公式img可计算出主要供电子系统和部件的可用度,如表2-5所示。

根据表2-5的数据及相关供电子系统可靠性模型,可计算供电子系统相关子系统可用度。

表2-4 主要供电子系统和部件的故障率和修复率数据

表2-5 主要供电子系统和部件的可用度

①配电子系统可用度。配电系统可靠性模型如图2-14所示。

图2-14 配电系统可靠性模型

这是个串联模型,并从表2-5查得:

A1=0.9999 9983 4738

A2=0.9999 9912 1013

因而配电系统的可用度为:

A=A1×A2×A1×A2×A1=0.9999 9774 6241

②电网可用度。220V/380V电网(机房市电电源)系统可靠性模型如图2-15所示。

图2-15 220V/380V电网机房市电电源系统可靠性模型

这是个串联模型,根据国家电力公司电力可靠性管理中心数据,2007年10kV电网的可用度为0.998817,及由表2-5查得:

因而220 V/380V电网电源系统的可用度为:

A=A1×A2×A3×A2×A4×A2×A3×A2=0.9988 1458 3841A=A1.2 ×[1-(1-A6.2 2]A′=A1.2 ×[1-(1-A6.2 2]×A8A1.2 =[1-(1-A1.1 )×(1-A5)]A1.1 =[1-(1-A1)×(1-A2)]×A3×A4A6.1 =[1-(1-A62]A6.2 =A6.1 ×A7

机房供电系统由市电电源、备用电源(备用市电、备用发电机)、低压配电系统、UPS系统(包含电池)、机柜专用配电等子系统构成。根据上面的分析,各级机房供电系统可用度如下。

③C级机房供电系统可用度。国标C级机房供电系统(基本配置为N)可用度框图如图2-16所示,包括单路市电电源、低压配电系统、无冗余UPS系统、机柜专用配电系统组成了最简单的机房供电系统。

图2-16 国标C级机房供电系统可用度框图

供电系统可用度为:

其中,电网可用度A1=0.9988 1458 3841。

配电系统可用度A2=A5=0.9999 9774 6241。

根据表2-5,UPS主机可用度:A3=0.9999 4883 9291。

UPS电池可用度:A4=0.9999 8303 0881。

计算得可用度:A=0.9999 4150 6652。(www.xing528.com)

④B级机房供电系统可用度。国标B级机房供电系统(冗余配置级为N+1)可用度框图如图2-17所示,包含市电电源、备用电源(柴油发电机)、低压配电系统、UPS冗余并机系统、专用机柜分配电系统。

图2-17 国标B级机房供电系统可用度框图

供电系统可用度为:

其中,UPS输入电源的可用度为:

交流输入电源的可用度为:

UPS“1+1”冗余并机系统的可用度为:

其中,电网可用度:A1=0.9988 1458 3841。

配电系统可用度:A4=A7=0.9999 9774 6241。

根据表2-5,柴油发电机可用度:A2=0.9999 3202 0398。

ATS可用度:A3=0.9999 4378 0437。

UPS主机可用度:A5=0.9999 4883 9291。

UPS电池可用度:A6=0.9999 8303 0881。

计算得可用度:

⑤A级机房供电系统可用度。国标A级机房供电系统(容错配置为2(N+1))可用度框图如图2-18所示,包含两路市电电源、备用电源、两套低压配电系统、冗余UPS系统、两路专用机柜分配电系统,组成了两套冗余配置的机房供电系统。

图2-18 国标A级机房供电系统可用度框图

双电源关键负载的供电系统可用度为:

单电源关键负载的供电系统可用度为:

其中,UPS输入电源的可用度为:

交流输入电源的可用度为:

UPS“1+1”冗余并机系统的可用度为:

一条母线供电系统的可用度为:

其中,电网可用度:A1=0.9988 1458 3841。

配电系统可用度:A4=A7=0.9999 9774 6241。

根据表2-6,柴油发电机可用度:A2=0.9999 3202 0398。

ATS可用度:A3=0.9999 4378 0437。

UPS主机可用度:A5=0.9999 4883 9291。

UPS电池可用度:A6=0.9999 8303 0881。

计算得可用度:

双电源关键负载的供电可用度为:

根据表2-5,STS的可用度:A8=0.9999 9360 5157。

单电源关键负载的供电可用度为:

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈