首页 理论教育 集群类型:高可用性、负载均衡和高性能计算

集群类型:高可用性、负载均衡和高性能计算

时间:2023-06-29 理论教育 版权反馈
【摘要】:集群较为常见的主要分为3种类型:高可用性集群/容错集群、负载均衡集群和高性能计算集群等。高可用性集群主要是为了使集群的整体服务尽可能可用。这种方法可以降低集群系统的运行费用。

集群类型:高可用性、负载均衡和高性能计算

集群较为常见的主要分为3种类型:高可用性集群(High Availability Cluster)/容错集群(Fail-over Cluster)、负载均衡集群(Load balancing Cluster)和高性能计算集群(High Per-formance Computing Cluster)等。

表6-12 NAS架构存储技术与集群存储技术的比较

978-7-111-36226-5-Chapter06-67.jpg

(一)高可用性集群

它是指当集群中的一个系统发生故障时,集群软件迅速做出反应,将该系统的任务切换到集群中其他正在工作的系统上执行。

高可用性集群主要是为了使集群的整体服务尽可能可用。如果高可用性集群中的主节点发生了故障,那么这段时间内将由次节点代替它。次节点是主节点的镜像,当它代替主节点时,它可以完全接管其身份。高可用性(HA)集群致力于使服务器系统的运行速度和响应速度尽可能快。它们通常利用在多台机器上运行的冗余节点和服务进行相互跟踪。如果某个节点失败,它的替补将在几秒钟或更短时间内接管它的职责。因此,对于用户而言,群集永远不会停机。有些HA集群还可以实现节点间冗余应用程序。即使用户使用的节点出了故障,他所打开的应用程序仍将继续运行,该程序会在几秒之内迁移到另一个节点,而用户只会感觉到响应稍微慢了一点。但是,这种应用程序级冗余要求将软件设计成具有集群意识的,并且知道节点失败时应该做什么。

1.高可用性集群的两种典型的拓扑结构:主从服务器和活动第二服务器

1)主从服务器结构:通常把一个服务器安排为“主”服务器,一个服务器为“第二”服务器,如图6-56所示。由主服务器为用户提供服务,第二服务器除了在主服务器出错时接管工作外,没有其他用处。

两台服务器通过一种被称为“心跳”(heartbeat)的机制进行连接,用于监控主服务器的状态,一旦发现主服务器宕机或出现不能正常工作的情况,心跳会通知第二服务器,接替出问题的主服务器。“心跳”可以通过专用线缆、网络链接等方式实现。

2)活动第二服务器结构:与主从服务器结构相似,也有两个服务器,不同之处是第二服务器可以处理其他的应用程序,当主服务器发生故障时,第二服务器能够接管主服务器的工作。这种被称为“活动第二服务器”方法的优点是在保持使用第二服务器的同时,获得服务器冗余,而不是仅仅把第二服务器作为备份使用。这种方法可以降低集群系统的运行费用。

2.活动第二服务器有三种实现形式:“全部复制”、“0共享”和“全部共享”

978-7-111-36226-5-Chapter06-68.jpg

图6-56 主从服务器结构示意图

1)全部复制模式:指完全的服务器冗余。每个服务器都有自己的磁盘。数据不断地被拷贝到第二服务器的磁盘上,以保证故障发生时,第二服务器可以使用当前的数据,如图6-57所示。

这种方法增加了服务器及网络的负载,可能会严重影响系统性能。另一个缺点是当一个服务器发生故障时,可能会有主、从服务器的不一致现象:某个磁盘上的事务处理可能并没有完全在另一个磁盘上得到继续。因为即便以最快的网络相连,两个服务器间信息传送仍会有一定的延迟。

由于数据被完全复制,所以应用程序可以在任一服务器上运行,从而可以更好地平衡负载。另外,节点在空间上可以是分散的,节点间可通过广域网互连,物理上可以距离很远。

2)“0共享”模式:是指两个服务器物理上连接到同一个磁盘组上,每个服务器都“拥有”自己的磁盘。在正常情况下,各服务器只能存取各自的数据。当一台服务器发生故障时,另一台服务器自动获得对方磁盘的读写权限,并对之进行操作,如图6-58所示。

978-7-111-36226-5-Chapter06-69.jpg

图6-57 全部复制模式示意图

978-7-111-36226-5-Chapter06-70.jpg(www.xing528.com)

图6-58 “0共享”模式示意图

这种方式不必不停地在服务器间拷贝数据,从而大大降低了网络负载。在这种方式下,磁盘是惟一可能产生导致长时间停机故障的地方。所以,在这种体系结构中,一般在磁盘子系统中采用RAID技术或者采用冗余镜像磁盘,以保证在磁盘出错时,应用程序和数据的可用性。

3)“全部共享”模式:让多个服务器在同一时间共享同一磁盘。在这种方式中,所有与磁盘相连的服务器在正常运行时可在相同时刻共享磁盘存取通道,如图6-59所示。这种方式要求开发一个复杂的锁定管理软件,保证在一个时刻只有一个服务器在读写数据。

978-7-111-36226-5-Chapter06-71.jpg

图6-59 “全部共享“模式示意图

“共享一切”方法采用RAID技术或磁盘镜像来保障数据的安全。由于每个服务器的数据被送到相同的磁盘上,所以不必在服务器间复制数据。这样在正常运作时,可以在不影响系统性能的前提下,提供高可用性。

高可用性集群系统功能比较如表6-13所示。

表6-13 高可用性集群对比

978-7-111-36226-5-Chapter06-72.jpg

(二)负载均衡集群

它是应用面最广、最有发展潜力的集群应用形式。随着视频监控系统规模发展,视频信息流几何级数增长,产生极大的网络流量负载和处理负载。此时,采用负载均衡集群是一个极好的选择。负载均衡集群一般用于Web服务器、代理服务器等。这种集群可以在接到请求时,检查接受请求较少,不繁忙的服务器,并把请求转到这些服务器上。网络负载均衡功能增强了Web服务器、流媒体服务器和终端服务等Internet服务器程序的可用性和可伸缩性。

所有节点对外提供相同的服务,这样可以实现对单个应用程序的负载均衡,而且同时提供了高可用性,性价比极高。网络流量负载均衡是一个过程,它检查集群的入网流量,然后将流量分发到各个节点以进行适当处理。负载均衡网络应用服务要求群集软件检查每个节点的当前负载,并确定哪些节点可以接受新的作业。因此,集群中的节点(包括硬件和操作系统等)没有必要是一致的。

负载均衡集群提供了一个非常实用的解决方案。负载均衡集群使负载可以在服务器集群中尽可能平均地分摊处理。负载通常包括应用程序处理负载和网络流量负载。这样的系统非常适合向使用同一组应用程序的大量用户提供服务。每个节点都可以承担一定的处理负载,并且可以实现处理负载在节点之间的动态分配,以实现负载均衡。对于网络流量负载,当网络服务程序接受了太多入网流量,以致无法迅速处理,这时,网络流量就会发送给在其他节点上运行的网络服务程序。同时,还可以根据每个节点上不同的可用资源或网络的特殊环境来进行优化

(三)高性能计算集群

是指以提高科学计算能力为目的计算机集群技术,是一种并行计算集群的实现方法。高性能计算集群具有响应海量计算的性能,主要应用于科学计算、大任务量的计算等。有并行编译、进程通信、任务分发等多种实现方法。高性能计算集群中使用的服务器通常可以分为用户节点、管理节点、存储节点和计算节点4种。

1)用户节点:提供用户管理的计算机,它从用户那里接受任务,运行调度器将任务分派到其他计算机,并将运算结果返回给用户。

2)管理节点:提供管理功能的计算机,它能够使管理员用这一计算机对集群中的任意一台计算机进行监视和操作,并处理集群中所有计算机的日志和报警信息。

3)存储节点:提供存储共享的计算机,为使任务可以并行执行,每台执行任务的计算机必须能够访问同样的数据。存储节点通过网络共享(NFS)或其他方式来确保数据访问的同步。

4)计算节点:真正执行计算任务的计算机,集群中的大部分计算机都是这种类型。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈