首页 理论教育 HPC集群机房建设与管理:不良环境的危害与解决

HPC集群机房建设与管理:不良环境的危害与解决

时间:2023-11-23 理论教育 版权反馈
【摘要】:当环境不良时,将对IT设备运行产生严重干扰或损坏。当机房温度过低时,部分IT设备将无法正常运行。表5-2静电电压产生量5.1.1.5灰尘对主设备运行的影响除温度和湿度之外,灰尘对IT类设备是更厉害的杀手。导致电子设备退化的

HPC集群机房建设与管理:不良环境的危害与解决

HPC集群机房的不良环境包括温度问题、湿度问题、灰尘等。当环境不良时,将对IT设备运行产生严重干扰或损坏。

5.1.1.1 高温对设备运行的影响

(1)温度与平均无故障运行时间的关系。

温度与平均无故障运行时间(MTBF)的关系:由于现代电子设备所用的电子元器件的密度越来越高,使元器件之间通过传导、辐射和对流产生热耦合。因此,热应力已经成为影响电子元器件失效率的一个最重要的因素。对于某些电路来说,可靠性几乎完全取决于热环境。为了达到预期的可靠性目的,必须将元器件的温度降低到实际可以达到的最低水平。有资料表明:环境温度每提高10℃,元器件寿命约降低30%~50%,影响小的也基本都在10%以上。这就是有名的“10℃”法则。

(2)高温对元器件的影响。

①半导体器件。电子元器件在工作时产生大量的热,如果没有有效的措施及时把热散走,就会使集成电路晶体管等半导体器件形成结晶,这种结晶是直接影响计算机性能、工作特性和可靠性的重要因素。

根据实验得知,室温在规定范围内每增加10℃,其可靠性约降低25%。

器件周围的环境温度大约超过60℃时,就将引起计算机发生故障,当半导体器件的结温过高时,其穿透电流和电流倍数就会增大。

②电容器。温度对电容器的影响主要是:使电解电容器电解质中的水分蒸发增大,降低其容量,缩短使用寿命,改变电容器的介质损耗,影响其功率因数等参数的变化。

由实验得知,在超过规定温度工作时,温度每增加10℃,其使用时间下降50%。

③记录介质。实验表明,当磁带、磁盘、光盘所处温度持续高于37.8℃时,开始出现损坏;当温度持续高于65.6℃时则完全损坏。

对于磁介质来说,随着温度的升高,磁导率增大;当温度达到某一值时,磁介质丢失磁性,磁导率急剧下降。磁性材料失去磁性的温度称为居里温度。

绝缘材料。由于高温的影响,用玻璃纤维胶版制成的印制电路板将发生变形甚至软化,结构强度变弱,印制板上的铜箔也会由于高温的影响而使粘贴强度降低甚至剥落,高温还会加速印制插头和插座金属簧卡的腐蚀,使接点的接触电阻增加。

电池环境温度与寿命的关系。电池是对环境温度最敏感的器件(设备),温度在工作温度25℃上,每上升10℃,寿命下降50%。

电池寿命与温度关系如图5-1所示。

图5-1 电池寿命与温度关系

5.1.1.2 低温对IT设备运行的影响

低温同样导致IT设备运行、绝缘材料、电池等问题。当机房温度过低时,部分IT设备将无法正常运行。

(1)机房温度过低导致设备无法运行。

机房的环境温度低于5℃时,通信设备将无法正常运行;机房的环境温度低于-40℃对,铅酸电池无法提供能量。

(2)绝缘材料。

低温时,绝缘材料会变硬、变脆,使结构强度同样减弱。对于轴承机械传动部分,由于其自身所带的润滑油受冷凝结,黏度增大而出现黏滞现象。

温度过低时,含锡量高的焊剂会发生分解,从而降低电气连接的强度,甚至出现脱焊、短路等故障。

(3)电池环境温度与放电容量的关系。

同样,当工作温度为25℃之下时,随着温度的下降,电池放电容量下降。

低温影响电池放电容量如图5-2所示。(www.xing528.com)

图5-2 低温影响电池放电容量

通常,湿度要求为40%~65%,在IT类设备工作时,要求湿度为40%~55%。超过65%的湿度,为湿度过高。如果湿度超过80%,属于潮湿。低于40%属于湿度过低(空气干燥)。

5.1.1.3 湿度过高对IT类设备运行的影响

当空气的相对湿度大于65%时,物体的表面附着一层厚度为0.001~0.01μm的水膜;湿度为100%时,水膜厚度为10μm。这样的水膜容易造成“导电小路”或者飞弧,会严重降低电路可靠性。

在相对湿度保持不变的情况下,温度越高,对设备的影响越大,这是因为水蒸气压力随温度升高而增大,水分子易于进入材料内部。

当相对湿度由25%增加到80%时,纸张的厚度将增加80%,这就是在潮湿的天气里,打印机无法正常工作的原因。

5.1.1.4 湿度过低对IT类设备运行的影响

静电放电(Electrostatic Discharge,ESD)是电子工业中普遍存在的“硬病毒”,在内、外因条件具备的特定时刻便会发作,已成为电子工业的隐形杀手。

据报道,仅美国电子工业每年因ESD造成的损失就达几百亿美元。根据Intel公司公布的资料显示,在引起计算机故障的诸多因素中,电气过应力(Electrostatic Over Stress,EOS)/ESD是最大的隐患,将近一半的计算机故障都是由EOS/ESD引起的,ESD对计算机的破坏作用具有隐蔽性、潜在性、随机性和复杂性的特点。

Intel公司统计计算机故障原因分布如图5-3所示。

图5-3 Intel公司统计计算机故障原因分布

IT类设备由众多芯片、元器件组成,这些元器件对静电都很敏感,不同的静电敏感器件受静电损伤的阈值电压如表5-1所示。

表5-1 静电损伤的阈值电压

在空气湿度过低(干燥环境)时,工作人员的活动非常容易产生静电。表5-2反映的在不同条件下人的各种动作所产生的静电电压。

实验表明,当机房相对湿度为30%时,静电电压为5000V;当相对湿度为20%时,静电电压为10000V;当相对湿度降到5%时,静电电压高达20000V以上。

根据IEC 61000-4-2测试标准,静电放电时,产生的瞬间电压可达到7000V,甚至超过10000V。

表5-2 静电电压产生量

5.1.1.5 灰尘对主设备运行的影响

除温度和湿度之外,灰尘对IT类设备是更厉害的杀手。

(1)腐蚀电路板。

微小颗粒吸收空气中的湿气后,在被微小颗粒污染的设备表面上形成电解层,这对许多金属会产生腐蚀作用。如果电解液浸透到导线保护层形成腐蚀点,并且该腐蚀点所处位置的导体有不同的电压,则在导线与导体之间就可能产生电弧,这样的电弧通常会烧坏元器件,严重的电弧会电解电路板形成导电电桥

(2)降低绝缘性能。

灰尘中存在大量的金属离子,这些金属离子与潮湿空气结合,就会降低电路与元器件的绝缘性能。

(3)灰尘影响散热,间接地促使零部件温度升高,影响寿命。

一定量的灰尘附着在电路与元器件上,影响散热效果,导致局部元器件的温度上升。导致电子设备退化的最主要环境因素是灰尘颗粒和水蒸气,暴露在潮湿空气中的电子设备被微小颗粒污染后,就可能产生故障,这种故障通常表现为串话和软故障。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈