监控系统充分利用计算机与通信技术对变电站的信息进行处理与分析,加之友好的人机界面,方便运行人员操作维护。
鉴于计算机或一些微处理器与电子元件是监控系统的主要硬件组成,因此,“死机”问题是影响微机监控系统正常运行的老大难问题,在“死机”问题上处理不好会直接影响到整个监控系统运行的稳定。众所周知,从微机监控系统的间隔层的测控保护装置、站控层的通信主单元到后台监控系统,硬件平台都采用了微处理器,即CPU,有的是基于单片机或高端DSP、32位CPU研发的硬件平台,有的是基于工控机、商用机一些高端工作站等所谓品牌计算机构成的系统,软件平台通常采用嵌入式操作系统、DOS系统、Windows系统,甚至采用UNIX操作系统,而且在硬件和操作系统的平台上开发了自己的应用程序,并加以运行。硬件、操作系统、应用程序任何一个出现问题,都有可能引起程序死锁,应用程序“走飞”,从而导致整个监控系统的部分功能失效,这就是通常所说的“死机”现象,也是许多微机监控系统普遍存在的问题。尽管造成死机的原因很复杂,有多方面的因素,但其原因永远也脱离不了硬件与软件两个方面。
1.监控系统的硬件故障
(1)散热不良。显示器、电源和CPU在工作中发热量非常大,因此保持良好的通风状况非常重要,如果显示器过热将会导致色彩、图像失真甚至缩短显示器寿命。工作时间太长也会导致电源或显示器散热不畅而造成计算机死机。CPU的散热是关系计算机运行稳定性的重要问题,也是散热故障发生的“重灾区”。
(2)移动不当。监控系统设备在运输过程中受到很大振动常常会使微机内部元器件松动,从而导致接触不良,引起计算机死机。所以,在运输或移动设备时应当避免野蛮装卸或剧烈振动,力求轻拿轻放。
(3)灰尘杀手。积尘会导致系统的不稳定,因为过多的灰尘附着在CPU、主板和风扇的表面会导致这些元件的散热不良,电路印制板上的灰尘在潮湿环境中容易造成短路。对于这种情况,可以用毛刷将灰尘扫去,但是要小心不要将毛刷的毛留在电路板和元器件上而成为新的故障源。部件受潮或者是板卡、芯片的引脚氧化也会导致接触不良和不正常,对于潮湿可以用电吹风将元件烘干,但是在操作时要注意不可加热太久或者温度太高,以防止元件损坏。引脚的氧化则可以用橡皮将表面的氧化物擦拭掉。
(4)设备不匹配。如主板主频和CPU主频不匹配,主板超频时将外频定得太高,可能无法保证运行的稳定性,因而导致频繁死机。
(5)软硬件不兼容。第三方软件和一些特殊软件,可能在有的计算机上就不能正常启动甚至安装,其中可能存在软硬件兼容方面的问题。
(6)内存条故障。主要是内存条松动、虚焊或内存芯片本身质量所致。应根据具体情况排除内存条接触故障,如果是内存条质量存在问题,则需更换内存条才能解决问题。
(7)硬盘故障。主要是硬盘老化或由于使用不当造成坏道、坏扇区。这样机器在运行时就很容易发生死机。可以用专用工具软件排障处理,如损坏严重则只能更换硬盘。
(8)CPU超频。超频是为了提高CPU的工作频率,同时,也可能使其性能变得不稳定。究其原因,CPU在内存中存取数据的速度本来就快于内存与硬盘交换数据的速度,若超频就使这种矛盾更加突出,加剧了在内存或虚拟内存中找不到所需数据的情况,这样就会出现“异常错误”。
(9)硬件资源冲突。是由于声卡或显示卡的设置冲突,引起异常错误。此外,其他设备的中断、DMA或端口出现冲突,也可能导致少数驱动程序产生异常,甚至死机。
(10)内存容量不够。内存容量越大越好,应不小于硬盘容量的0.5%~1%,如出现这方面的问题,就应该换上容量尽可能大的内存条。
(11)劣质零部件。少数不法厂商在组装计算机时,使用质量低劣的板卡、内存,有的甚至出售冒牌主板、CPU或内存,这样的机器在运行时很不稳定,发生死机在所难免。因此,在选购计算机时应该保持警惕,可以采用一些较新的工具软件测试计算机,长时间连续拷机(如72 h),以及争取尽量长的保修时间等。
2.监控系统因软件原因引起的死机
(1)病毒感染。运行人员玩游戏、上网,容易遭到病毒的感染,病毒可以使计算机工作效率急剧下降,造成频繁死机。可采用杀毒软件如KV300、金山毒霸、瑞星等进行全面查毒、杀毒,并做到定时升级杀毒软件,并在管理上制订禁止在监控主机上下载游戏或玩游戏等规章制度。
(2)设置不当。该故障现象很普遍,如硬盘参数设置、模式设置、内存参数设置不当,从而导致计算机无法启动。如将无ECC功能的内存设置为具有ECC功能,这样就会因内存错误而造成死机。(www.xing528.com)
(3)系统文件的误删除。
(4)动态链接库文件(DLL)丢失。在Windows操作系统中还有一类文件相当重要,即扩展名为DLL的动态链接库文件,这些文件从性质上来讲属于共享类文件,也就是说,一个DLL文件可能会有多个软件在运行时需要调用它。如果在删除一个应用软件时,该软件的反安装程序会记录它曾经安装过的文件并准备将其逐一删去,这时就容易出现被删掉的动态链接库文件,同时还会被其他软件用到的情形,如果丢失的链接库文件是比较重要的核心链接文件,那么系统就会死机,甚至崩溃。
(5)硬盘剩余空间太少或碎片太多。一些应用程序运行时需要大量的内存,操作系统将自动开设虚拟内存,而虚拟内存则是由硬盘提供的,因此硬盘要有足够的剩余空间以满足虚拟内存的需求。同时用户还要养成定期整理硬盘、清除硬盘中垃圾文件的良好习惯。
(6)软件升级不当。大多数人可能认为软件升级是不会有问题的,事实上,在升级过程中都会对其中共享的一些组件也进行升级,但是其他程序可能不支持升级后的组件,从而导致各种问题,也会引起死机,甚至系统崩溃。
(7)滥用测试版软件。系统安装了一些处于测试阶段的应用程序,因为这些测试版的应用软件通常带有一些BUG或者在某方面不够稳定,使用后会出现数据丢失的程序错误、死机或者系统无法启动。
(8)非法卸载软件。不要把软件安装所在的目录直接删掉,如果直接删掉,注册表以及Windows目录中会有很多垃圾存在,久而久之,系统也会变得不稳定而引起死机。
(9)使用盗版软件。因为这些软件可能隐藏着病毒,一旦执行,会自动修改系统,使系统在运行中出现死机。
(10)应用软件的缺陷。应用软件因固有的技术水平限制而产生的缺陷,也会引起死机。
(11)启动程序太多。这使系统资源消耗殆尽,使个别程序需要的数据在内存或虚拟内存中找不到,也会出现异常错误。
(12)非法操作。用非法格式或参数非法打开或释放有关程序,也会导致计算机死机。
(13)非正常关闭计算机。不要直接使用机箱上的电源按钮,否则会造成系统文件损坏或丢失,引起自启动或者运行中死机。对于Windows 98/2000/NT等系统来说,这一点非常重要,严重的,会引起系统崩溃。
(14)内在冲突。有时运行各种软件都正常,但忽然间莫名其妙地死机,重新启动后运行这些应用程序又十分正常,这是一种假死机现象。出现的原因多是操作系统的内存资源冲突。大家知道,应用软件是在内存中运行的,而关闭应用软件后即可释放内存空间。但是有些应用软件由于设计的原因,即使在关闭后也无法彻底释放内存,当下一个软件需要使用这块内存地址时,就会出现冲突。
(15)驱动程序冲突。在安装某些硬件设备驱动程序时,由于安装不当,造成底层驱动程序发生冲突,如中断冲突、端口冲突等,这些都会造成操作系统的死锁。
(16)编制的软件是否合理。在操作系统稳定的情况下,监控应用软件的开发技术是监控系统稳定的关键。软件的开发要考虑许多细节、许多技巧来避免程序运行与操作系统的不兼容,如指针误指、数组越界、对于所采集或接收的数据缺乏合理性校验、运行进入死循环、单个进程在短时间内过分占用CPU时间、对共享资源(如硬盘数据库资源等)访问冲突、误用不完备的底层机制等。
(17)通信死锁。通信死锁主要与所用通信介质的处理机制有关,经常发生于需要冲突侦听检测机制的总线型通信网络上。例如,如果一路RS-485总线上在某一瞬间同时出现多个主设备或由于干扰等原因使得总线上瞬间出现类似电气特性的情况下,总线上某些通信芯片可能会发生“电平卡死”现象,当然,这也与通信芯片能否在此种情况下具备自身恢复机制有关。对于以太网,当出现“广播风暴”情况时,网络有可能会发生瘫痪。此外,如果一个局域以太网建立了过多的流连接,也会大大降低网络效率,甚至造成网络瘫痪。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。