开方式、统一集成的自动化运营平台整体架构,如图3。该架构以云平台为基础,通过开方式的接口,将IaaS 层和SaaS 层的管理数据相衔接,实现集中管控,一体化运营[4]。
图3 自动化平台整体架构规划
在云平台层,DCOS(Data Center Operating System)定位数据中心操作系统,用于支撑数据中心对物理资源(如物理服务器和网络设备)生命周期进行自动化管理,是银行云平台的物理基础架构管理引擎,也是云平台中最基础、最核心的模块;虚拟化是云平台的关键技术,也是云平台的核心功能模块之一,该模块主要是在云服务器上创建云主机,通过透明化底层物理硬件,突破实体资源的使用限制,实现具有生命周期的资源调配与共享;监控服务提供服务器和网络融合的一站式监控及告警引擎,涵盖服务器及网络硬件部件采集、进程采集、端口采集等信息,实现服务器及网络硬件异常告警,并支持把原始监控和告警数据以API 开放给对接平台;负载均衡技术建立在网络架构之上,提高网络数据处理的并发能力和灵活性,实现网络请求转发和自动负载均衡;云安全提供主机入侵防御服务,WAF(Web 应用防护系统)实时防护等功能,保障基础资源运行安全。因此,由云平台的IaaS 层提供基础资源运行数据至自动化运营管理平台,在避免不同应用重复部署资源管理引擎的同时,确保数据的使用口径一致,提高数据使用效率。
自动化运营管理平台的上层是业务系统应用层,一般包括四个方面的运营需求,一是业务交易相关的监控和告警;二是信息系统服务可用性监控和管理;三是信息系统自动化部署持续集成管理;四是基础资源的使用情况及运行趋势。当前,有些产品化的信息系统,将上述运营需求作为运营管理的子系统模块,集成到产品平台中,随产品发布的时候部署。如果每个银行应用系统都采用各自的运营模块独立部署,不仅会造成基础资源信息的重复收集,而且会影响银行ECC(Enterprise Command Center)统一运营枢纽集中监控告警信息的一致性,甚至涉及部署层面生产账户的授权问题,让管理的复杂度加大。因此,需要信息系统的产品服务商,结合云平台的基础资源管理优势和产品本身对于业务交易数据更易获取和管理的优势,以API 接口形式和自动化运营管理平台进行对接,实现运营数据的交互。对接思路是:自动化运营平台将基础资源的运营数据,通过API 接口传递给应用层,供应用层做业务运行分析,包括资源的运行趋势分析;应用层反过来将业务交易的统计数据和监控告警指标,通过API 接口传递给自动化运营平台,由平台通过大屏展示业务统计数据,并依据统一的预警规则实现监控告警及事件问题一体化管理。针对应用系统的自动部署集成部分,则结合DevOps 的持续集成管理工具或平台,实现集成化的一键部署功能。
作为核心层的自动化运营管理平台,更像是一个开方式、统一集成运营管理的最佳实践方案,而非严格按照某种技术架构和开发平台实施的一套产品。该实践方案将运营环节的管理思维融入ITSM 运营服务流程、自动化集成管理工具,以及日常运营维护管理的各项工作之中,在保障信息系统安全、稳定运行的同时,将全生命周期、全员参与的运营理念体现在数字化的平台功能之上。(www.xing528.com)
1)统一集成CMDB 视图
配置管理数据库(Configuration Management Database,简称CMDB),是自动化运营平台的核心数据库,提供基础架构的逻辑模型,并鉴别、控制、维护和验证现有配置项的版本等信息。配置管理包含系统部件版本、主要组成和相互关系等的鉴别、记录和报表功能,保存各系统部件之间的关系,包括与之相关的事件、问题、变更请求和版本发布。配置管理中列出云平台设备清单,关注设备类型、物理位置、设备的使用者、发生过多少次变更等,为其他服务管理流程提供当前的、准确的资源信息。CMDB 配置项设置的完整性及数据的准确性,是整个自动化平台有效运行的基础。
2)统一门户
统一门户为所有运营相关的环节提供一体化展示的空间,包括运营维护人员的工作台展示和运营信息的共享。它将ITSM 服务管理、自动化集成管理、运营维护管理等环节和信息系统建设、投产和运行的全生命周期主线融合到一起,体现快速交付,支持业务发展的一致性目标。简单以银行信贷系统建设为例:在场景化和大数据应用模式下,新一代的数字零售银行产品,融科技、数据和业务能力于一体打造系统平台,包括系统平台的工具化。在系统建设初期,通过自动化运营平台获取云平台基础资源的类型、可用量以及对应的资源成本,用于研发团队进行成本投入分析;在系统建设过程中,涉及信贷系统与支付、总账系统进行批量调度的交互时,可通过自动化集成管理的自动化调度系统,分析各系统间的调度依赖关系,将信贷系统批量纳入统一的调度任务中;在投产部署环节,则通过自动化集成管理的自动化部署功能对接生产发布,并进一步通过自动化监控、自动化备份等功能,实现投产后运营管理目标的设定;而在生产运行时,日常巡检及自动化监控告警的数据,通过生产事件和问题跟进,反过来促进信贷系统的迭代优化,以及与自动化运营平台的更深度交互。
在实际的自动化运营过程中,集成到平台的每个模块或功能,在保障安全可靠的前提下,均可以选择最快速高效和最适用的工具或技术,不断建设和完善。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。