首页 理论教育 HPC集群机房建设与管理:重点设备维护效果

HPC集群机房建设与管理:重点设备维护效果

时间:2023-11-23 理论教育 版权反馈
【摘要】:HPC集群机房重点设备有空调设备、配电设备、监控设备、气体灭火设备、防雷设备、网络设备。运行温度直接关系到干式变压器的使用寿命,所以维护人员应重点检查维护风机自动控制系统、超温报警、跳闸系统以及温度显示系统。

HPC集群机房建设与管理:重点设备维护效果

HPC集群机房重点设备有空调设备、配电设备、监控设备、气体灭火设备、防雷设备、网络设备

7.4.2.1 空调设备的维护

(1)空气处理机的维护。

空气处理机的维护主要有如下6点:

①空气处理机的保温性能维护。如果失去保温作用,就会造成空气处理机组壁板结露,使送风温度偏高。

②漏风现象的维护。送风、回风道和静压箱漏风过大会导致送风量不足。

③空气处理机表面清洁。风机转动部件无灰尘、油污,皮带转动无异常摩擦。

④过滤器清洁。滤料无破损,透气孔无堵塞、无变形。

蒸发器叶片应明亮无阻塞、无污痕。

⑥叶片水槽冷凝水盘应干净、无沉积物,冷凝水管应畅通。

(2)风冷冷凝器的维护。

冷凝器在制冷系统中起着热交换的作用。因冷却水大多数含有钙、镁离子和酸式碳酸盐,产生水垢,当冷凝器使用时间长了,管路工作表面会受到污染,热量交换的有效面积和管内容积将减少,使热交换效率降低,同时也会增加流动阻力,性能就会逐渐下降,其结果会使系统的冷凝压力高于正常运行时的冷凝压力。为了不使冷凝器的性能下降,需要定期对冷凝器排除污垢,提高制冷效率和延长使用寿命。

冷凝器的维护主要有以下6点:

①风扇支座紧固,基座不松动,无风化现象;电机和风扇扇叶应无灰尘、油污;扇叶转动正常,无抖动和摩擦。

②定期检查压缩机皮带是否良好,如果启动空调时有“吱吱”的噪声,说明皮带打滑严重,应及时更换皮带和皮带轮;如果皮带过松则会影响空调制冷。

③经常检查、清洁冷凝器的翅片,应保持其无灰尘、油污。接线盒和风机内无进水。

④每年都应该更换一次空调的滤网,滤网上经常沾着各种灰尘杂质,不光会影响出风,而且可能制造异味。

⑤预防性保养包括清洗换热器铜管,分析和更换冷冻机油、油滤芯、干燥过滤器等。

⑥对水冷式冷凝器,主要是清除水垢的问题。消除周期依水质而论,水质差的至少每年清洗一次;水质好的,可2~3年清洗一次。

(3)压缩机的维护。

压缩机的维护要注意如下7点:

①周、月、季的维护。

·每周的维护包括检查机组有无异常声响和泄漏;检查仪表读数是否正确;检查温度显示是否显示正常。

·每月的维护包括检查机内是否有锈蚀、松动之处,如有锈蚀则去锈上油或涂漆,松动处上紧;排放冷凝水。

·每季的维护包括清除冷却器外表面及风扇罩、扇叶处的灰尘;加注润滑油电动机轴承上;检查软管有无老化、破裂现象;检查电器元件,清洁电控箱。

②用高、低压氟利昂表测试高低压保护装置,发现问题及时排除。

③经常用手触摸压缩机表面温度,有无过冷过热现象,发现有较大温差时,应查明原因。

④检查冷管道的固定有无松动或振动情况。

⑤检查冷管道保温层,发现破损应及时修补。

⑥制冷管道应畅通,发现堵塞及时排除。

⑦压缩机补油。在运行状态下,压缩机的油位应保持在最低与最高油位之间,油多会影响分离效果,油少会影响机器润滑及冷却性能。在换油周期内,如果油面低于最低油位,应及时补充润滑油,方法是:

·停机等内压释放完毕(确认系统无压力),拉下电源总开关。

·打开油气分离罐上的加油口,补充适量的冷却润滑油。

·压缩机冷却润滑油的更换时间取决于湿度、尘埃和空气中是否有酸碱性气体。新购置的空压机首次运行500h须更换新油,以后按正常换油周期每4000h更换一次,年运行不足4000h的机器应每年更换一次。

·油过滤器在第一次开机运行300~500h必须更换,第二次在使用2000h更换,以后则按正常时间每2000h更换一次。

·每次换油时,须同时更换油过滤器。

(4)加湿器的维护。

加湿器的维护要注意如下4点:

①保持加湿水盘和加湿罐的清洁,定期清除水垢。

②检查给排水管路,保证畅通,无渗漏、无堵塞现象。

③检查电磁阀的动作、加湿负荷电流和控制器的工作情况,发现问题及时排除。

④检查电极、远红外管,保持其完好无损、无污垢。

(5)冷却系统的维护。

冷却系统的维护要注意如下6点:

①冷却循环管路畅通,无跑、冒,各阀门动作可靠。

②冷却水泵运行正常,无锈蚀,水封严密。

冷却塔风机运行正常,水流畅通,播撒均匀。

④冷却水池自动补水、水位显示及告警装置完好。

⑤循环水水质检查。循环水水质限定值如表7-3所示。

表7-3 循环水水质限定值

⑥定期清洗冷却水池,清除冷却水池内的杂物。

(6)电气控制的维护。

电气控制的维护应注意如下8点:

①检查各类温度传感器、压力传感器控制器、水流控制器、温度计、压力表安装有无松动,发现问题立即处理。

②定期检查报警器声、光报警是否正常,接触器、熔断器有无松动或损坏,发现问题及时排除。

③检查继电器和电子元件有无损坏和变质,发现问题及时更换。

④测量设备的保护接地线,如果引线接触不良,应及时紧固。

⑤测量设备的绝缘电阻,检查导线有无老化现象。

⑥检查配电箱、开关箱时,必须将其前一级相应的电源开关分闸断电.并悬挂停电标志牌,严禁带电作业

⑦各种电气箱内不允许放置任何杂物,并应保持清洁。箱内不得挂接其他临时用电设备。

⑧熔断器的熔体更换时,严禁用不符合原规格的熔体代替。

7.4.2.2 配电设备的维护

配电设备是电力系统的重要组成部分,配电设备的维护目的是检查并及时处理供配电设备隐患,满足设备在良好的条件下运行,确保设备性能,保证安全运行。维护的重点是干式变压器、电力电容器、互感器、直流系统、UPS、低压配电柜的维护检查、高压配电柜的维护检查、变压器的维护检查。

(1)干式变压器的运行维护。

干式变压器在配电系统中的作用是在交流电网中改变电压、传递能量。干式变压器维护重点是干式变压器运行温度。运行温度直接关系到干式变压器的使用寿命,所以维护人员应重点检查维护风机自动控制系统、超温报警、跳闸系统以及温度显示系统。

干式变压器的运行维护应重点注意如下8点:

①冷却系统的运行方式是否符合要求,冷却装置(风扇、油、水)是否运行正常,各组冷却器、散热器温度是否相近。

②变压器的声音是否正常。正常的声响为均匀的嗡嗡声,如声响较平常沉重,表明变压器过负荷;如声音尖锐,说明电源电压过高。

绝缘子瓷瓶、套管)是否清洁,有元破损裂纹、严重油污及放电痕迹。

④油枕、充油套管、外壳是否有渗油、漏油现象,有载调压开关、气体继电器的油位、油色是否正常。

⑤变压器的接地引线、电缆母线有无过热现象。

⑥外壳接地是否良好。

⑦装置控制箱内的电气设备、信号灯运行是否正常;操作开关、联动开关位置是否正常;二次线端子箱是否严密,有无受潮及进水现象。

⑧变压器室的门、窗、照明应完好,房屋不漏水,通风良好,周围无影响其安全运行的异物(如易燃、易爆和腐蚀性物体)。

(2)电力电容器的运行维护。

电力电容器在配电系统中主要是用来补偿无功功率,提高功率因数。为了保证电力电容器的正常运行,延长其有效使用寿命,在日常运行维护中应注意如下6点:

①外观检查。对于运行中的电力电容器进行外观检查,是否有喷油、渗漏油现象;是否有鼓肚、开裂现象;是否有接线头过热现象,如有上述情况应立即停止使用,更换。

温湿度的控制。电力电容器运行的一般环境温度在-20℃~45℃,如果温度过高或过低,容易引起电力电容器发生鼓肚、渗油等现象,同时要保证室内湿度不得超过80%。

③清理冷却风道及外壳灰尘,使电容器散热良好。

④检查接头处、接地线是否有松脱或锈蚀,如有则应除锈处理并拧紧。

⑤电流值检查。检查电容器三相不平衡电流是否超过额定值的15%或电容缺相,如是则更换电容器。

⑥检查熔体与保险座是否接触良好,接触部分是否有烧伤痕迹,如有则应进行修整,修整达不到要求的则应更换。

(3)互感器的运行维护。

互感器分电流互感器电压互感器

①电流互感器的维护:电流互感器要定期检查接头有无过热,是否有异常的声音,是否有异味,有无破损放电现象,瓷质部分是否清洁。一旦发现上述现象应及时处理、更换,避免发生事故。

②电压互感器的维护:要定期检查电压互感器的绝缘是否清洁,有无裂纹、缺损及放电现象,有无严重的渗油和漏油现象,有无异声等,一旦发现上述现象应及时处理、更换,避免发生事故。

(4)直流系统的运行维护。

直流系统是用来为高压断路器、继电保护、自动装置、信号母线等提供操作电源的,由充电柜和电池柜组成。

为了保证直流设备的正常运行,要定期进行检查:

①高频开关模块的输入和输出电压不得过高或过低,因长期过高电压运行会损坏其内部元件。过低电压会造成直流母线电压过低时断路器不能跳闸和合闸。

②蓄电池应存放在干燥、通风、室温不超过25℃、湿度不超过70%的环境中。长期保存的蓄电池,应半年进行一次充放电,在放电状态下,将其清理干净。

(5)UPS的维护。

UPS的维护要注意如下5点:

①UPS的负载使用要求有如下两方面。

·UPS不宜满载或轻载。每台UPS标有额定功率,但一般情况下,不要按照UPS标称的额定功率满载使用。一般情况下,后备式UPS选取额定功率60%~70%的负载量;在线式UPS选取额定功率70%~80%的负载量。如果UPS长期处于满载状态,会造成UPS逆变器整流滤波器的过热,影响UPS的使用寿命。同样,UPS的负载量在50%状态下运行也是不可取的。如果UPS长期放置不用会导致电池组的损坏。

·UPS电源不可过载。如果UPS过载运行,在蓄电池供电过程中由于逆变器的过载保护功能,UPS会因过载而中断输出,从而造成不必要的损失。由于过载出现问题,它所连接的各种精密电子仪器也会受到影响,甚至掉载。

②温度要求。UPS电源对环境温度的要求较高,一般为0℃~40℃,最佳温度为25℃±2℃。温度过高,逆变器将会停止工作并报警,同时也影响电池的寿命;温度过低,将影响蓄电池的输出能力。因此,UPS电源室内要控制温度。

③每4~6个月检查一次蓄电池组中各电池的端电压和内阻,若单个电池的端电压低于其最低临界电压或电池内阻大于80m时,应及时更换或进行均衡充电。

④UPS长期处于市电供电状态时,应每隔一段时间对UPS电源进行一次人为断电,使UPS电源在逆变状态下工作一段时间,以激活蓄电池的宽放电能力,延长其使用寿命。

⑤UPS长期不用时,每隔一段时间须充电一次。蓄电池的充电间隔时间与环境温度密切相关,温度越高,充电时间间隔越短。

(6)低压配电柜的维护检查。

低压配电柜的维护检查如表7-4所示。

表7-4 低压配电柜的检查表

(7)高压配电柜的维护检查。

高压配电柜的维护检查如表7-5所示。

表7-5 高压配电柜的维护检查表

(8)变压器的维护检查。

变压器的维护检查如表7-6所示。

表7-6 变压器的维护检查表

7.4.2.3 监控设备的维护

HPC集群机房监控设备主要包括供配电监测系统、空调环境检测系统、门禁监控系统、保安监控系统(包含摄像头、软件部分)和统一监控管理平台软件。监控设备的维护要做到“五防”、“四齐”。“五防”:防潮、防尘、防腐、防雷、防干扰。“四齐”:备件齐、配件齐、工具齐、仪器齐。

监控设备的维护要重点注意如下6点内容:

(1)监控设备维护的注意点:

·对每个设备所供电源的插座要经常检查,防止插头脱落。

·保证对每个设备的供电电压较恒定。

·对监控设备的维护要做到“五防”、“四齐”。

(2)硬盘录像机的维护包括以下方面:

·防潮、防尘。电路板上的灰尘在受潮后会引起短路,为了使硬盘录像机能长期正常工作,应该定期用刷子对电路板、接插件机箱视频风机、机箱等进行除尘。

·防干扰。保持硬盘录像机电源插座上中间接地端接地良好,以避免视频、音频信号受到干扰,以及避免硬盘录像机被静电损坏。

·视频、音频信号线以及CONSOLE、RS232、RS485等接口都不能带电插拔,否则容易损坏这些端口。

·硬盘录像机关机时,不要直接关闭电源开关,应使用菜单中的关机功能,或面板上的关机按钮,使硬盘录像机自动关掉电源,以免损坏硬盘。

·保持硬盘录像机机箱周围空气流通,以利于散热。

(3)摄像机的维护包括以下方面:

·注意防潮。潮湿是摄像机的大敌,高度的潮湿会造成摄像机内部的金属部分生锈、电路部分短路、镜头部分的镜片发霉等,极端情况会在磁鼓表面形成水珠,此时如果放入磁带,磁带会粘贴在磁鼓上,随着磁鼓的高速旋转而将磁带和机器同时损坏。

·注意防振。振动会对摄像机的机械部分产生不良影响。现在的数字摄像机机械部分十分精密,有的机械元件厚度不到0.5毫米,而其导柱的定位精度是以微米计算的,因此较强烈的振动有时会造成机械错位,甚至电路板松脱。使用时应尽量避免强烈的振动,特别要防止机器摔到地上。

·注意防尘。摄像机转速高,特别是数字摄像机,转速高达每分钟9000转,这样高的转速,如果磁头遇到机内的灰尘,有时会受到损害;同时,机器里的灰尘会造成磁头的瞬时堵塞而影响拍摄的图像质量。因此摄像机使用时应注意防尘。

(4)每季度一次设备的除尘、清理,扫净监控设备显露的尘土,对摄像机、防护罩等部件卸下彻底吹风除尘,之后用无水酒精棉将各个镜头擦干净,调整清晰度,防止由于机器运转、静电等因素将尘土吸入监控设备机体内,确保机器正常运行。同时检查监控机房通风、散热、净尘、供电等设施。给机房监控设备一个良好的运行环境。

(5)根据监控系统各部分设备的使用说明,每月检测其各项技术参数及监控系统传输线路质量,处理故障隐患,协助监控主管设定使用级别等各种数据,确保各部分设备各项功能良好,能够正常运行。

(6)对容易老化的监控设备部件每月进行一次全面检查,一旦发现老化现象应及时更换、维修。

7.4.2.4 灭火系统的维护

应使消防报警及火灾灭火系统正常运行,使系统随时处于准工作状态,能够随时发现灾情、及时控制联动系统动作,并迅速将灭火系统投入运行以控制灾情。

HPC集群机房气体灭火设备的维护重点:火灾报警系统维护的一般要求、气体灭火系统检查内容、气体灭火装置的维护、七氟丙烷灭火系统的维护、气溶胶灭火系统的维护,IG-541灭火系统的维护、二氧化碳灭火系统的维护。

(1)火灾报警系统维护的一般要求。

系统投入正常使用后,为确保运行正常和可靠性,必须严格按定期检查制度进行定期检查。定期检查分每日检查、每周检查、每月检查、每季检查和年检。

①每日检查:人员每日应检查集中报警控制器和区域报警控制器的功能(如火警功能、故障功能、复位、消音等)是否正常,有关指示灯有否损坏,值班人员应将检查、处理问题情况记录在册。

②每周检查:进行主、备电源自动转换试验。

③每月检查:每月定期到现场查看消防主机打印记录和消防值班记录,了解消防系统运行情况,对出现的运行故障进行处理;对消防主机进行检查并记录;检查探测器的报警准确性、报警主机运行状况、联动请求的正确性。了解消防设施有无被人为损坏或其他损坏情况。

④每季检查:每季度对火灾自动报警系统的功能应作下列试验和检查:

·按生产厂家说明书的要求,用专用加烟(或加温)等试验器分期分批试验探测器的动作是否正常。

·确认显示灯是否清晰。

·试验中发现有故障或失效的探测器应及时拆换。

·试验火灾警报装置的声、光显示是否正常,在实际操作试验时,可一次全部进行试验也可部分进行试验,但试验前一定要作好妥善安排,以防造成不应有的恐慌和混乱。

·有联动控制功能的系统,应自动或手动检查消防控制设备的控制显示功能是否正常。

·七氟丙烷、气溶胶、二氧化碳等固定灭火系统的控制设备是否正常。

·火灾事故广播、火灾事故照明及疏散指示标志灯均应有信号反馈至消防控制室,且信号清晰。

·检查所有的手动、自动转换开关,如电源转换开关、灭火转换开关、防排烟、防火门、防火卷帘等转换开关、警报转换开关、应急照明转换开关等是否正常。

·进行强制切除非消防电源功能试验。

·直观检查所有消防用电设备的动力线、控制线、报警信号传输线、接地线、接线盒及设备等是否处于安全无损状态。

·检查探测器、手动报警按钮和指示装置的位置是否准确,有无缺漏、脱落和丢失,每个探测器下方及周围各方向、手动报警按钮的周围是否留有规定的空白空间。可燃气体探测器应按生产厂家说明书的要求进行试验和检查。

⑤年检:每年对火灾自动报警系统的功能应作下列检查试验,并填写年检登记表。

·按生产厂家说明书的要求,用专用加烟(或加温)试验器对安装的所有探测器分期分批进行检查试验,至少全部检查试验一遍。

·季度试验和检查中各项所列的检查和试验项目进行动作试验。

·季度试验和检查中进行模拟试验。

·试验火灾事故广播设备的功能是否正常,在试验中不论扬声器当时处于何种工作状态(开或关),都应能紧急切换到火灾事故广播通道上,且音响清晰。

·检查所有接线端子是否松动、破损和脱落。(www.xing528.com)

探测器投入运行2年后,应每隔3年全部清洗一遍,并做响应阚值及其他必要功能试验,合格者方可继续使用,不合格者严禁重新安装使用。

消防系统设备的检查、维护、保养均应有完整的记录,分类归档管理,保存期5年。

(2)气体灭火系统检查内容。

气体灭火系统检查的主要内容:

①对灭火剂储存容器、选择阔、液体单向阀、高压软管、集流管、阀驱动装置、管网与接嘴等全部系统组件进行外观检查。系统组件应无碰撞变形及其他机械性损伤,表面应无锈蚀,保护涂层应完好,铭牌应清晰,手动操作装置的防护罩、铅封和安全标志应完整。

②灭火剂储存容器内的压力,不应小于设计储存压力的90%。

③气动驱动装置的气动源的压力,不应小于设计压力的90%。

④每年应对气体灭火系统进行两次全面检查,检查内容和要求除按月检规定的检查外,还应符合下列规定:

·防护区的开口情况、防护区的用途及可燃物的种类、数量、分布情况,应符合设计规定。

·灭火剂储瓶间设备、灭火剂输送管道和支、吊架固定,应无松动。

·高压软管应无变形、裂纹及老化;必要时,对每根高压软管进行水压强度试验和气压严密性试验。

·各喷嘴孔口,应无堵塞。

·对灭火剂储存容器逐个进行称重检查,灭火剂净重不应小于设计量的95%。

·灭火剂的输送管道有损伤与堵塞现象,对其进行严密性试验和吹扫。

·对每个防护区进行一次模拟自动启动试验,如有不合格项目,则应对相关防护区进行一次模拟喷气试验。

⑤每月至少对系统进行一次外观检查,应符合下列要求:

·设备就位正确,无碰创、固定牢靠。

·设备工作状态正常,无泄露现象。

·线路、仪表指示正常,标牌、安全指示正常。

(3)气体灭火装置的维护。

气体灭火装置的维护要重点注意如下几点:

①灭火装置投入使用后,严禁擅自拆卸、移动。

②灭火装置应由经过专门培训的人员负责检查和维护。

③使用单位每月应对灭火装置巡查一次,发现问题应及时处置:

·灭火装置的喷口正前方1.0m内,不允许有器具或其他阻碍物。

·灭火装置不能受到雨淋、水浇、水淹等不利条件影响。

·连接灭火装置的紧固件或支架的固定应牢固,无松动现象。

·灭火装置的线路连接和控制显示应正常。

·灭火装置应保持清洁,标牌、安全标志完好。

④灭火装置的使用年限应符合产品说明规定,到期应及时报废、更新。

⑤灭火装置的定期维护应填写灭火装置维护管理记录。

(4)七氟丙烷灭火系统的维护。

七氟丙烷灭火系统的维护要重点注意如下几点:

①维护人员应熟悉该系统的结构、工作原理、性能和动作程序,以及各阀件的结构与工作状态。

②维护人员应了解各保护区灭火系统所投入设备的种类、数量、位置和工作状态。

③维护人员应熟悉灭火系统启动的应急操作以及灭火后系统恢复工作的内容及操作。

④检查七氟丙烷的储存压力,如压力表指针不在绿色正常区域内,或在储存温度下压力指示的数值与压力表盘对应的数值不相符时,应卸下储存瓶,进行称重检查,查明原因及时排除,按设计要求重新补充灭火剂。

⑤从储存瓶上卸下的电磁启动器,使用系统自身的灭火控制线路进行通电检查,应启动正常,检查完毕后电磁启动器装置必须复位。

⑥对橡胶密封件进行抽检,看是否出现老化现象。

⑦每5年对系统进行一次全检:

·卸下七氟丙烷储存瓶,进行称重检查。

·对阀件进行拆洗、重新试验,并对全系统重新调试。

⑧每月对系统进行一次外观检查,并符合下列要求:

·设备就位正常。

·设备无碰撞损伤、堵塞、固定牢靠。

·设备工作状态正常。

·管网、设备无泄漏现象。

·线路连线、仪表指示正常。

·标牌、安全标志完好。

⑨每年进行一次年检,年检主要内容如下:

·检查七氟丙烷的储存压力,如压力表指针不在绿色正常区域内,或在储存温度下压力指示的数值不符时,应卸下该储存瓶,进行称重检查。查明原因及时排除,按设计要求重新补充药剂和增压氮气,并按编号各就各位。

·从启动容器阀上卸下电磁启动器,使用系统自身和灭火控制线路进行通电检查,应启动正常。

·对“O”形圈等橡胶密封件进行抽查,看其是否老化、损伤,出现老化现象,应进行更换。

⑩每5年对系统进行一次全检,全检主要内容如下:

·卸下每个七氟丙烷储存瓶,进行称重检查。

·对管网系统进行强度和气密性试验。

·对管网阀件及启动瓶组进行行拆洗重装、重新试验。

·对系统重新调试。

(5)气溶胶灭火系统的维护。

气溶胶灭火系统的维护要重点注意如下7点内容:

①每月应对系统中的气溶胶自动灭火装置、分区启动器、分区通用接口和手动操作装置进行外观检查,并应符合下列规定:

·应无碰撞变形及其他机械性损伤;

·溶胶自动灭火装置的喷口应无阻塞;

·表面应无腐蚀,保护涂层应完好;

·手动操作装置的防护罩、分区启动器的锁闭装置和有关安全设施、安全标志应完好。

·使用电子万用表测量回路阻值和负载电阻。

·信号反馈端是常开端口,检查是否短路或对地短接。

·灭火装置启动部分检查同路阻值(1~3Ω)。

·填写热气溶胶自动灭火装置维护记录表。

②每半年应断开分区启动器对系统检查下列功能:

·火灾探测器的正确性;

·联动设备动作的可靠性;

·对备用电源进行1~2次充放电试验,1~3次主备电源自动切换试验。

③每年应断开自动灭火装置的负载,检验启动系统工作的可靠性,并应有检验记录。

④每年应进行一次年检,年检主要内容如下:

·探测设备运行情况检查,主要检查连接线路及探测器的灵敏性。

·控制设备运行情况检查主要包括控制器接受火灾信号情况(包括探测、急启、急停、反馈);控制器接受故障信号情况(包括探测、急启、急停、反馈、主备电、阀线);控制器联动性能及各个被联动器件的性能。

⑤气溶胶灭火装置运行情况检查,主要检查灭火装置的电性能。

⑥灭火系统联动模拟试验正常。

⑦建立灭火系统使用档案,对使用、检查、维修与试验做详细记录。

(6)IG-541灭火系统的维护。

由于IG-541灭火系统的储存压力与系统释放压力均在高压范围之内,维护人员必须具有一定的基本技能和专业知识才能胜任,因此规定IG-541灭火系统应由经过专门培训并经考核通过的专人负责,定期检查和维护。IG-541灭火系统的维护要重点注意如下2点内容:

①检查灭火剂储存容器、容器阀、选择阀、单向阀、高压软管、压力讯号器、喷嘴、阀驱动装置等系统组件的外观:

·系统组件无碰撞变形及其他机械性损伤。

·组件外露非机械加工表面保护涂层完好无锈蚀。

·组件所有外露接口均设有防护盖,且封闭良好,接口螺纹和法兰密封面无损伤。

·储存容器内的压力不得小于设计储存压力的90%。

·气动驱动装置的气动源的压力不得小于设计压力的90%。

②系统应每半年对气体灭火系统进行一次全面检查。检查内容包括:

·防护区的开口情况、防护区的用途及可燃物的种类、数量、分布情况,应符合原设计规定。

·灭火剂储存容器间设备、灭火剂输送管道和支、吊架固定,应无松动。

·高压软管应无变形、裂纹及老化;必要时,应对每根高压软管进行水压强度和气压严密性试验。

·各喷嘴孔口应无堵塞。

·对灭火剂储存容器逐个进行称重检查,灭火剂净重不得小于设计储存量的95%。

·灭火剂的输送管道如有损伤与堵塞现象,应进行严密性试验和吹扫。

(7)二氧化碳灭火系统的维护。

二氧化碳灭火系统的维护要重点注意如下3点内容:

①二氧化碳灭火系统密封性能要求严。为了确保工作的可靠性,应按规定建立完善的检查和维护制度,制定操作规程。对系统应定期检查并做好记录。

·高压软管应无变形、龟裂和老化现象,必要时应按国家标准对每根进行水压强度试验和气压密封性试验,或更换。

·每年应检查灭火剂重量一次,当发现瓶内的CO2:重量减少到原来重量的10%时,应及时补充气体或更换新充装的CO2气瓶。

·检查时如发现容器阀的气体出口处有泄漏现象,可顺时针旋转内大角顶杆,微量往下压即可实现密封。若确认阀上的安全膜片因超压而爆破(19±0.95Mpa),则必须更换膜片,并重新充装CO2气体。

·每月应检查选择阀一次,检查时用扳手扳动两个来回,最后必须扳回到原来“关”的位置上。

②系统灭火启用后,应将下列各部分恢复到原来的位置,方可继续使用。

·二氧化碳灭火控制器按钮复位。

·将容器阀恢复原工作状态。

·按设计要求重新充装灭火剂。

·所有被拆卸过的管路,必须安装正确,保证密封。

③在维护过程中,必须严格按照《气体灭火系统施工及验收规范》(GB 50263-97)的有关规定执行。

7.4.2.5 防雷设备的维护

防雷装置的维护分为周期性维护和日常性维护两类。

(1)周期性维护。

周期性维护的周期为一年,每年在雷雨季节到来之前,应进行一次全面检测。主要检查连接处是否紧固、接触是否良好、接地引线有无锈蚀、接地体附近地面有无异常。维护的重点如下:

①外部防雷装置的电气连续性,若发现有脱焊、松动和锈蚀等,应进行相应的处理,特别是在断接卡或接地测试点处,应进行电气连续性测量。

②检查避雷针、避雷带(网、线)、杆塔和引下线的腐蚀情况及机械损伤,包括由雷击放电所造成的损伤情况。若有损伤,应及时修复;当锈蚀部位超过截面的三分之一时,应更换。

③测试接地装置的接地电阻值,若测试值大于规定值,应检查接地装置和土壤条件,找出变化原因,采取有效的整改措施。

④检测内部防雷装置和设备(金属外壳、机架)等电位连接的电气连续性,若发现连接处松动或断路,应及时修复。

⑤检查各类浪涌保护器的运行情况:有无接触不良、漏电流是否过大发热、绝缘是否良好、积尘是否过多等,出现故障,应及时排除。

⑥利用测试仪测试防雷器老化或损坏情况

(2)日常性维护。

应在每次雷击之后进行。在雷电活动强烈的地区,对防雷装置应随时进行目测检查,发现问题应及时处理。

7.4.2.6 网络设备的维护

机房网络设备维护的重点内容有服务器日常维护、路由器日常维护、交换机日常维护、防火墙日常维护。

HPC集群机房内的网络设备相对比较复杂,应按照网络供应商提供的各种技术参数进行管理维护,本书在此不再详述,只介绍最常用的KVM管理系统。

KVM是键盘(Keyboard)、显示器(Video)、鼠标(Mouse)的缩写。所谓KVM主机切换系统,就是用一套或数套KVM在多个不同操作系统的多台主机之间切换,实现一个用户使用一套键盘、鼠标、显示器去访问和操作一台以上主机的功能,KVM产品不但能管理服务器系绕,而且能管理网络串口设备以及硬件设备的电源,同时还能实现近端和远程任意地访问机房的设备。

KVM的核心思想是,通过恰当的键盘、鼠标和显示器的配置,实现系统和网络的高可管理性,提高管理人员的工作效率,提高机房安全级别,节约机房面积,降低网络服务器系统的总体拥有成本(TCO)。

(1)KVM的发展历程。

KVM系统技术经过几十年的发展日渐成熟,已由最初功能简单的模拟KVM切换器发展到目前可以实现远程管理的数字KVM系统,总共经历了以下三个发展阶段。

①模拟KVM切换器:最初的模拟KVM切换器通过切换控制端与多个被控端间的键盘、鼠标及显示器信号线路来实现一对多控制。

模拟KVM切换器的应用在当时实现了对单个机柜内的多台PC服务器的集中操控,基本上废弃了为每台PC服务器配置独立的键盘、显示器和鼠标的控制模式。模拟KVM切换器在应用中也存在很多问题,它只能逐个地切换控制多个设备中的一台,无法并行控制;只支持PC的鼠标、键盘及显示器接口,无法连接小型机等其他接口类型设备;控制距离仅限于15m;系统稳定性差,经常出现键盘或鼠标故障、显示缺色及屏闪现象;为了确保稳定性,被控端的连接数一般限制在8台以内。

②模拟KVM交换矩阵:模拟KVM交换矩阵是KVM切换器的换代产品。KVM交换矩阵在功能上有了较大突破,实现了多路并发控制不同被控端设备;有效控制距离加大,最远距离可达300m;使用标准网线传输,方便楼宇和机柜内的布线;实现了对更多控制接口类型设备的控制;实现了简单的控制权限管理功能。模拟KVM交换矩阵仍是模拟硬件系统,由KVM矩阵交换机、控制工作站、接口转换器及网络双绞线四部分组成。

模拟KVM交换矩阵系统的实现较为复杂,接口转换器连接并汇集被控端的键盘、鼠标及显示器三路信号,通过网线将信号传输到KVM交换矩阵的被控端口,不同端口连接不同被控端的接口转换器;控制工作站直接连接控制时使用的键盘、鼠标及显示器;控制工作站通过标准网线连接到KVM交换矩阵的控制端口,不同端口连接不问的控制端工作站。在控制工作站及被控端到KVM交换矩阵的信号传输上使用了标准的网络布线,但所传输的信号不是标准的网络信号,而是KVM交换矩阵特有的模拟信号。专用接口转换器可以在KVM矩阵交换机掉电的情况下始终维持被控端的键盘与鼠标处于连接状态。在控制画面的质量和稳定性方面,模拟KVM交换矩阵与KVM切换器相比,有较大幅度的提高。

模拟KVM交换矩阵在2007年之前一直应用较广,通过它基本上实现了机房的人机隔离管理模式。KVM交换矩阵有效控制距离的延长以及多路并发控制功能使得各控制端可以分布在楼宇内多个不同的房间;对更多接口类型的支持将小型机终端及PC服务器等设备都纳入统一的操控平台中;利用控制权限管理功能使得管理员只能管理自己权限范围内的设备;将KVM交换矩阵多层级联应用时可以实现对更多设备的控制。

③数字KVM系统:数字KVM系统由模拟设备彻底转变为数字化设备,最大的突破是利用网络技术实现了对机房设备加电启动级的远程控制,这也正是模拟KVM系统的致命缺陷。数字KVM实现了远程的多对多控制;所能管理的设备类型扩展到PC服务器、小型机及网络设备等;远程即可重启或关闭相应设备的电源;具有远程虚拟媒体功能,可为被控制设备虚拟添加USB存储器;通过加密技术、认证机制、用户等级权限机制及操作日志记录功能等实现了更高级别的安全管理机制;采用特殊技术压缩并传送控制屏幕数据,降低对网络带宽的需求以达到最佳的控制效果,一般50Kbps的网络带宽就可以达到较好的控制效果。2007年,数字KVM系统已经较为成熟并逐步被广泛应用。

(2)KVM的发展趋势。

随着IT系统在企业中重要性的提升,以及IT设备的复杂多样性,带外管理系统(KVM Over IP和Console Over IP)技术在数据机房的服务器等关键IT设备的管理中开始发挥越来越重要的作用,应用的需求带动带外管理技术的提升和发展。

带外管理技术在近几年的发展和今后几年的发展趋势包含以下4个方面:

①带外管理设备的高容量和低耗电和低机柜空间占用率。由于数据机房的数量越来越多,机房IT设备也不断增长,使得对带外管理系统的性能容量提出了新的要求。KVM交换机的端口容量增加,耗电和机柜空间的节省成为今后业界的产品技术发展方向。在集中控制设备上,对用户数的要求、集中管理节点数量的要求也越来越高。

②嵌入式KVM技术在服务器中的广泛应用。随着KVM Over IP技术的不断进步,硬件的集成度也越来越高,因此将KVM Over IP技术直接内置在服务器中已经成为现实,未来将会有越来越多的服务器厂商支持这种技术。

③更加安全稳定和易用。由于IT系统对带外管理系统越来越依赖,系统的安全稳定性将是未来技术的发展方向之一。全硬件化的系统、系统设备的冗余硬件结构:如链路冗余、电源冗余、存储介质冗余;更加严格的用户验证体系、日志审核体系和加密体系;更加简单易用,如具备一定的任务自动执行功能和配置简单、使用简单。

④开放式的系统。为了方便用户的使用和提高维护效率,带外管理系统和带内管理系统在用户层面将整合为一个系统,实现在同一界面下的对IT设备的“监控→问题发现→问题识别→问题修复处理”一站式解决方案。

(3)KVM在HPC集群机房的应用特点。

在HPC集群机房内安装KVM设备,其应用特点主要体现如下:

①实现了人机分离的操作模式:作为目前HPC集群(数据中心)机房的一个普遍管理模式,在控制室可以方便管理机房的主机设备,而且这种KVM集中管理级别达到跨平台的硬件级水平,克服了一般软件管理的不能跨平台、占用服务器进程等缺点。

②扩展空间、优化配置:免除不必要的外围设备而节省空间。减少KVM的数量,为新增加的服务器等主机设备腾出大量的空间,也避免了因搬迁而造成企业服务的停顿。

③提高效率、保障系统:由一套KVM组成的控制台便可登录所有的主机设备;不同的维护人员通过不同的控制台可以管理各自的主机设备(服务器、网络设备、存储设备)。通过操作模式的选择,有利于多个管理人员协同工作,互不干扰,方便协同排除故障和系统演示。

④及时、便捷地处理机房问题:不仅减少了机房布线的复杂性,而且有利于机房的整齐规划。使用强大的用户管理,提升了机房整体的分析和管理。

⑤集中、安全地管理服务器:不必担心进/出机房所带来的不安全因素,在操控室便可以对机房的主机设备进行集中管理。确保了机房的安全,对主机的切换独立于网络。不会占用网络资源及主机资源。不会对整个机房的运行造成任何不利影响。提供具有远程维护的扩展功能。

⑥扩容方便:KVM设备可级联扩展,可轻松地扩容到几百个连接端口。满足各种类型机房的应用。

(4)KVM系统的设计原则。

KVM系统的设计原则主要包括如下内容:

①跨平台。KVM切换器可以在不同的服务器环境中运行。选购KVM必须考查产品是否提供完整的平台兼容性(支持PS/2和USB双接口,以及PC、Mac、Sun等多种平台),并且具有可以独立于不同的硬件、操作系统和应用程序的兼容能力。

②扩展性。在选择KVM方案时,必须评估是否能提供全方位的产品线、最大化的扩充性、多平台支持能力以及近距离与远程连接访问控制。无论选择的是整合不同资源端的IT资源还是分散式IT资源的集中化管理,KVM应该具备处理现在及未来IT运作复杂度的弹性能力。

③安全性。当KVM开始采用IP技术后,虽然推动了服务器与用户端的远程控制技术,但也带来了另一个隐患,即系统管理员最关心的安全问题。企业应该树立一个重要的观念:部署基于IP的KVM时,千万不要忽视安全性问题,并且应该更进一步地加强认证、登录密码、加密等防范措施,为此,高级的IP-based KVM都会提供多层安全访问控制管理。

④连接方式。如今的KVM已经由过去昂贵、体积笨重、连接线复杂、传输距离有限的传统形象转变为不受距离限制并且可以带外(out-of-band)进行服务器连接的全新设计。这对于7×24h不间断提供关键任务服务的HPC集群机房(数据中心)来说,将拥有多种连接弹性。如果能够妥善运用多样化的连接方式,技术人员将可全面提高管理效率,可以有效节省成本、机房空间,并且减少管理人员数量。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈