首页 理论教育 银行数据中心架构和认知计算对运维管理的影响

银行数据中心架构和认知计算对运维管理的影响

时间:2023-07-25 理论教育 版权反馈
【摘要】:静态架构是过去二十年数据中心的一种主流模式。目前,对数据中心的认知计算没有明确的定义,但是可以基本理解为:利用机器学习和人工智能,实行对数据中心的自动化管理,提高数据中心的效率。而数据中心管理团队通过机器学习对这些数据进行研究,并建立起模型来预测并进一步改进数据中心能效。高的准确率意味着管理人员对该数据中心下一步的能量需求情况了如指掌,从而可以通过设置调整进一步提升能效。

银行数据中心架构和认知计算对运维管理的影响

对于传统的数据中心来说,数据中心基础设施、硬件资源和软件系统在安装部署完成时,就形成匹配关系,并且这种匹配关系被固定下来。只有在硬件资源出现故障或者需要进行淘汰升级时,才会把软件系统迁移到新的硬件资源上运行。这种长期稳定的匹配关系所构成的基础架构被认为是一种静态架构。

静态架构是过去二十年数据中心的一种主流模式。它的优点是简单,符合常规管理习惯。数据中心基础设施、硬件资源和软件系统的静态固定式匹配,使得管理员在后期的运维中可以按照规定模式进行管理。它的缺点是硬件资源的使用效率低下,并常常伴随着软件系统的性能问题:在软件系统负载小的时候,硬件资源无法充分利用,造成资源浪费;在软件系统负载大的时候,已分配的硬件资源无法支撑压力,造成性能瓶颈。

随着IT的发展,云计算、软件定义网络(Software Defined Network,SDN)等技术的发展,数据中心规模的扩大和功能趋向于多样性,随之出现的问题是数据中心的可靠性以及维护管理的巨大成本。动态架构(Dynamic Infrastructure)是数据中心需要面对的发展趋势之一。

基于动态架构的数据中心,用户可以按照需要弹性分配适当的应用配置,并且支持动态扩展。具体功能特点包括以下5个方面。

(1)部署 包括部署服务器、网络和存储服务等资源。

(2)7×24h监控 包括收集运行情况数据来更好地满足SLA需要,监控资源利用情况;客户自我监控。

(3)优化 包括持续监控和在不影响或少影响应用运行的情况下主动根据运行需要来调整和迁移服务器;按需要分配“合适”资源,不超配和低配。

(4)保护 包括防病毒、垃圾访问过滤和防火墙等;应用和数据备份;保证99.9%正常运行时间和基础设施的物理安全。

(5)灵活适配 包括容易调整环境、部署新资源;存储、带宽等根据需要可以动态调整;支持不同虚拟技术,并可以管理不同类型的虚拟机

动态数据中心解决方案的逻辑架构可以分为以下5层。

(1)基础架构层 基础架构层是数据中心所需的电力、制冷和网络接入等基础设备的集合。

(2)资源层 资源层是服务器、网络设备和能力(包括交换、防火墙设备等)、存储等设备的集合,这是一个融合了各种物理IT资源的基础层。

(3)虚拟化层 虚拟化层是平台的核心之一,主要提供对物理设备的抽象以及未来对应用的虚拟化能力。在这一层,动态数据中心能够集成多种的虚拟化技术和多种的客户机操作系统。(www.xing528.com)

(4)管理层 管理层主要是提供对虚拟化资源、物理资源的管理能力以及负载均衡等网络服务能力,包括对计算资源的自动配置、动态的分配、系统的备份和监控等。这一层的功能不会直接开放给最终用户以及系统管理员,而是将能力提供给最上层的服务层,由服务层的相关功能来完成资源管理能力的集成,尽可能屏蔽用户对不同资源管理能力的要求。

(5)服务层 服务层包括两个方面:核心系统管理的服务和服务层门户。核心系统管理的服务主要是指将管理平台的能力通过标准的编程接口对外提供服务,可以给其他应用使用,另外服务层门户也是通过这些编程接口与管理层进行集成的。服务层门户主要包括自助服务门户和管理门户。前者是提供给平台用户使用,可以让用户能完成产品的订购、资源的调整、提交服务申请等功能;后者是提供一个集成的系统管理员功能,完成对资源的分配、审核、服务开通、系统安全保障等能力。

动态架构数据中心解决方案的逻辑架构如图14⁃7所示。

978-7-111-51885-3-Part05-7.jpg

图14⁃7 动态架构数据中心解决方案的逻辑架构

随着动态架构数据中心解决方案的逐步发展,更为超前的数据中心认知计算也被提出来。目前,对数据中心的认知计算没有明确的定义,但是可以基本理解为:利用机器学习人工智能,实行对数据中心的自动化管理,提高数据中心的效率。

互联网数据中心已通过其数据中心的传感器数据基础数据,通过神经网络的机器学习算法,建立预测模型,利用人工智能来进一步改进数据中心能效。

该数据中心决定利用神经网络对复杂系统建模的优势,让其数据中心能效更上一层楼。该数据中心部署了上万个数据点来收集数据中心基础设施和电能使用信息。系统每30s就计算一次PUE,还不断跟踪IT设备能耗、机外气温以及制冷和机械设备的设置情况:包括服务器总负载,水泵冷却塔冷水机组、干式冷却器、运行中的冷水注水泵数量;冷却塔水温、湿球温度、户外湿度、风速、风向等。而数据中心管理团队通过机器学习对这些数据进行研究,并建立起模型来预测并进一步改进数据中心能效。

数据中心利用神经网络不需要用户预设模型,而是在特征中寻找模式和交互,然后自动生成最佳匹配模型的特征。结果表明,该模型的预测准确率达到了99.6%,如图14⁃8所示。高的准确率意味着管理人员对该数据中心下一步的能量需求情况了如指掌,从而可以通过设置调整进一步提升能效。

上述情况下,该数据中心进行电力基础设施升级要重新调整40%的服务器流量,但是通过PUE仿真与专家知识的结合,数据中心管理团队选定了一套新的运营参数,从而将PUE下降了0.02。可以预见,未来认知计算、动态自适应技术,将越来越多地用于数据中心基础设施与IT系统的集成管理上。

978-7-111-51885-3-Part05-8.jpg

图14⁃8 神经网络最佳匹配模型

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈