上节介绍了数值天气预报业务系统的软件环境,本节主要介绍支撑整套业务系统运行的高性能硬件设备。
4.4.3.1 硬件性能
针对中尺度气象模式业务系统的运算特点,可以总结出以下几个性能特性:
(1)计算量巨大。数值预报模式的计算量巨大,而业务系统时效性要求又非常高,这就要求模式必须在规定的时间内稳定、快速运行,输出预报结果。
随着人们对NWP分辨率、预报精度提出的要求越来越高,对计算资源的需求也变得越来越大。理论上NWP空间分辨率每提高一倍,其所需计算量将提高到原来的16倍。在上述情况下,依靠单个CPU或普通的计算机是无法完成模式计算任务的。数值天气预报业务系统都需依赖于大型运算集群和并行计算。
(2)通信密集。由于数值天气预报模式一般采用差分格点模式进行并行计算,所以运行NWP时计算机各个CPU之间的通信量很大,这对系统的通信性能提出了非常高的要求,这就要求业务系统具有高性能的通信网络。
(3)时效性强。数据的应用需求决定了数值天气预报业务系统必须具备很强的实效性。一般的数值天气预报业务系统每天在固定的2~4个时段内运行,单次时段运行不超过4~6h。此外,数值天气预报业务系统也可能承担一部分试验作业的运行任务,这些作业与常规业务运行之间存在相同时刻运算资源共享的问题,对此需要设置、执行合理的业务逻辑。
(4)计算量集中。运行数值天气预报预报模式对计算机性能要求非常高,要求在数小时内运行完成海量数据处理及计算,这些作业每天在相同时刻运行,必须保证这些模式可以按时计算完毕。(www.xing528.com)
因此,构建一个中尺度数值天气预报业务系统,在配置基础硬件环境时需要满足高性能计算能力、高性能网络环境、高I/O带宽和高系统稳定性等条件。
4.4.3.2 集群系统
所谓集群系统是一种由互相连接的计算机组成的并行或分布式系统,可以作为单独、统一的计算资源来使用。集群系统能利用高性能通信网络将一组计算机(节点)按某种结构连接起来,在并行化设计及可视化人机交互集成开发环境支持下,统一调度、协调处理,实现高效并行计算。
常见的集群类型包括科学集群、负载均衡集群和高可用性集群。科学集群通常设计为开发和运行高速并行计算应用程序,以解决复杂的科学问题。科学集群对外就像一个超级计算机,这种超级计算机内部由十至上万个独立处理器组成。它利用NFS、NIS等软件环境构建单一系统映像,并且在不同的计算节点间通过消息传递接口(Message Passing Interface,MPI)进行节点间通信和数据交换,以运行并行应用程序。其处理能力与真正的超级计算机相仿,但是硬件以及运行维护费用要比真正的超级计算机低很多,具有极高的性价比。
负载均衡集群使负载可以在计算机集群中尽可能平均地分摊处理。负载通常包括应用程序处理负载和网络流量负载。这样的系统非常适合向使用同一组应用程序的大量用户提供服务。每个节点都可以承担一定的处理负载,并且可以实现处理负载在节点之间的动态分配,以实现负载均衡。对于网络流量负载,当网络服务程序接受了高入网流量,以致无法迅速处理时,网络流量就会发送给在其他节点上运行的网络服务程序。同时,还可以根据每个节点上不同的可用资源或网络的特殊环境来进行优化。
高可用性集群能够增强计算硬件和软件的容错性,使集群的整体服务尽可能可用。当集群中的一个系统发生故障时,集群软件迅速做出反应,将该系统的任务分配到集群中其他正在工作的系统上执行。如果高可用性集群中的主节点运行失败或者故障,它的替补者将在几秒钟或更短时间内接管它的职责。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。