首页 理论教育 云计算管理平台的规划与布局

云计算管理平台的规划与布局

时间:2023-06-20 理论教育 版权反馈
【摘要】:云计算管理平台规划包括体系结构、云门户管理平台、云资源管理平台、高性能计算管理平台、运维管理平台、运维管理制度及实施等几大部分。图6.18大连市智慧水务云计算管理平台架构6.4.6.2 云门户管理平台云门户管理平台为用户和运营人员提供管理门户功能,用户和运营人员可通过门户使用云资源池的相关功能。

云计算管理平台的规划与布局

云计算管理平台规划包括体系结构、云门户管理平台、云资源管理平台、高性能计算管理平台、运维管理平台、运维管理制度及实施等几大部分。

6.4.6.1 体系结构

云计算管理平台可以为资源使用者通过自服务的方式提交资源申请,资源管理人员进行批复的使用流程,以及资源自动管理和动态分配、部署、配置、重新配置以及回收资源,也可以自动安装软件和应用。云计算管理平台包括云门户管理平台、云资源管理平台、云运维管理平台(包括业务管理与运营管理)、云并行计算管理平台,如图6.18所示。

图6.18 大连市智慧水务云计算管理平台架构

6.4.6.2 云门户管理平台

云门户管理平台为用户和运营人员提供管理门户功能,用户和运营人员可通过门户使用云资源池的相关功能。

运营管理门户是运营管理平台提供给云资源池系统的管理员和用户访问云资源池系统相关运营管理功能的人机操作界面和功能访问入口。在逻辑上,云资源池系统运营管理平台门户可以按照服务对象分为服务门户和管理门户,但在实际开发建设中,可使用统一的门户向云资源池系统管理人员和用户提供访问入口,通过角色定义和权限控制来区分管理人员和用户。

1.服务门户

服务门户是为用户提供的自服务界面。服务门户主要功能包括以下内容。

(1)资源目录查询。

(2)用户资源实例管理(申请、查询、变更、终止等)。

(3)用户管理。

(4)用户资源监控管理。

(5)用户统计报表查询。

云门户管理平台为用户提供分配所需资源并完成基本的资源部署的功能。云资源池系统为用户提供的资源包括计算资源、存储资源以及网络资源。系统应该提供用户自助申请资源和自动部署资源的功能,尽量减少云管理员的手工操作。并支持资源的大规模批量部署。资源申请功能包括但不限于以下内容。

(1)物理机资源申请。

(2)虚拟机资源申请。

(3)分布式存储资源(如文件存储或对象存储,以及架构在文件或对象之上的记录存储)申请。

(4)盘阵存储资源(如SAN或NAS等)申请。

(5)负载均衡资源申请。

(6)防火墙资源申请。

(7)静态IP地址资源申请。

虚拟机资源申请功能可允许用户选择特定物理机或物理机群组来安装虚拟机。资源部署功能主要包括以下内容。

(1)虚拟机或物理机的操作系统安装。

(2)通用软件(如HTTP/FTP/Mail/SSH等服务器软件)的安装与配置。

(3)IP地址分配与配置。

(4)负载均衡设备的资源配置。

(5)防火墙设备的资源配置等。

云资源池系统还可为用户提供自动部署软件的功能,以方便用户对多台物理主机或虚拟机进行软件统一安装和部署。用户提供软件,编写软件部署脚本,并选择部署目标机器,云资源池系统负责将软件上传至目标机器并运行部署脚本,以完成部署任务。

2.管理门户

管理门户是为云资源池系统管理人员和操作人员提供的操作界面和功能访问入口,管理门户主要功能包括以下内容。

(1)资源目录管理。

(2)资源管理。

(3)资源实例管理(创建、审核、查询、变更、终止等)。

(4)监控管理。

(5)用户管理。

(6)统计分析等。

3.门户安全

运营管理平台可提供一定的安全机制保障该平台的正常运行,如使用加密算法对敏感数据进行加密,提供基于HTTPS的安全访问链接等。

6.4.6.3 云资源管理平台

整个复杂的云计算架构中,必须通过一个强大的管理平台来实现对硬件资源的整合和虚拟化,对功能服务器的模板制作与部署,对云计算资源进行启动、停止、删除、回收等,对整个云计算平台运行性能进行实时监控和日志报告等。

云资源管理系统通过虚拟化技术和基于策略的自动化管理技术,构建虚拟化资源池,实现对物理资源、虚拟资源的统一管理和分配。

云资源管理系统架构需要实现的功能包括以下几方面。

(1)设备管理。提供对物理设备的接入和管理功能,包括设备展示、配置部署、告警上报等。

(2)虚拟适配层(VLA)。提供对不同虚拟层(VMM)的适配、集成功能,如VMware、Xen、KVM、Hyper-V等,对上层屏蔽不同虚拟层差异,提供统一的虚拟化管理接口。(www.xing528.com)

(3)云适配层。提供对不同云资源的适配功能,实现公有云和私有云资源的统一管理功能。

(4)虚拟化资源池管理。实现计算、存储和网络的虚拟化和资源统一管理。

(5)资源池调度。提供资源动态分配、动态能耗管理、调度策略管理、资源池高可用性和备份恢复等功能。

(6)资源池服务。对外提供基础资源池服务功能,如动态伸缩、负载均衡等。

(7)对外接口。对外提供标准的接口和功能,供上层业务或解决方案集成。

(8)管理系统。提供云资源池的统一管理维护功能,如用户管理、日志管理、告警和性能监控。

6.4.6.4 高性能计算管理平台

云的基本概念是通过网络将庞大的计算处理程序自动分拆成无数个较小的子程序,再由多部服务器所组成的庞大系统搜索、计算分析之后将处理结果回传给用户终端。通过这项技术,远程的服务供应商可以在数秒之内,达成处理数以千万计甚至亿计的信息,达到和“超级电脑”同样强大效能的网络服务。

由于大连市智慧水务系统云数据中心需要承载计算密集型业务应用系统,如宏观数据分析系统,虽然此类应用较少,但还是应予以考虑,因此云计算管理平台还应包含云并行计算管理平台。

云并行计算管理平台主要分为高性能计算管理和分布式存储管理。

6.4.6.5 运维管理平台

大连市智慧水务系统云数据中心基础设施运维管理系统解决方案是“IT管理思想+系统工具”的组合,它不仅是管理软件产品本身,而且还包括管理流程(process)、管理规范(policy)、业务(business),并将管理流程、管理规范、业务贯彻到软件产品中。为数据中心提供的IT运营管理解决方案不仅提供软件产品工具,还包括管理流程与规范、业务及实施方法在内的全方位建设。

大连市智慧水务运维管理平台功能架构如图6.19所示。

图6.19 大连市智慧水务运维管理平台功能架构

1.运维管理平台总体逻辑架构

运维管理平台逻辑架构如图6.20所示,主要分为以下几个部分。

(1)监控管理平台。主要实现对业务应用系统所支撑的网络设施和重要服务器进行监控管理。实现对IT运维网络系统的综合管理。

(2)服务管理平台。接收各类事件,并按照预先定义的事件管理流程完成事件处理,为大连市智慧水务云数据中心提供统一完整的自动化、电子化的IT服务管理流程。

(3)数据接入平台。主要负责统一接入各类网络设备、主机系统、第三方网管系统等,负责数据的采集、处理、装载和采集线路的检测。

(4)门户管理平台。主要负责系统功能呈现,采用门户技术使用户使用更加方便和灵活,并实现用户使用个性化。

图6.20 运维管理平台逻辑架构

2.运维管理平台部署方案

运维管理平台监控系统采用集中部署方式,大连市智慧水务云数据中心运维人员通过远程登录系统的方式,实现对本级网络的运行监控。

运维管理平台监控系统的监控对象包括:大连市智慧水务云数据中心城域网的网络核心设备,大连市智慧水务云数据中心各行政部门、各行业的软硬件设备及应用软件。

在大连市智慧水务云数据中心,通过以太网技术连接部署应用/Web服务器、数据库服务器、采集服务器等。应用/Web服务器主要完成系统的应用服务以及Web发布,数据库服务器主要完成系统的数据库服务功能,需要保证满足所有业务应用和全部用户规模的需求以及未来3年的要求。

鉴于采用总部集中的部署方式,还需要建立采集服务器,通过规定的协议方式及时限,采集所有网元对象的监控信息。

6.4.6.6 运维管理制度及实施

1.运行维护管理制度

为确保运行维护工作正常、有序、高质地进行,必须针对运行维护的管理流程和内容,制定相应的运行维护管理制度,实现各项工作的规范化管理。运行维护管理制度可分为系统和应用管理制度、故障管理制度、人员管理制度和质量考核制度等。

(1)系统和应用管理制度包括对主机、数据库、中间件、应用系统的配置管理制度、运行/监控管理制度、数据管理制度等。

(2)故障管理制度包括对故障处理过程的管理制度、故障处理流程的变更管理制度、故障信息利用的管理制度及重大故障的应急管理制度等。

(3)人员管理制度包括对运行维护人员的能级管理制度、奖惩制度、考核制度、系统外部人力资源使用的管理制度等。

(4)质量考核制度包括制定相关制度,对以上各类制度的执行情况进行考核。

2.运行维护组织实施

为保证运行维护体系的高效、协调运行,应依据管理环节、管理内容、管理要求制定统一的运行维护工作流程,实现运行维护工作的标准化、规范化。运行维护流程包含的环节有日常运行维护、用户的运维请求、故障处理、问题跟踪、运行维护知识库、决策分析。各个环节的关系如图6.21所示。

图6.21 运行维护组织图

(1)日常运行维护。各级运行维护人员根据岗位职责和运行维护管理制度,利用技术支持技术手段和工具,进行应用系统的日常维护、状态监控和安全管理,定期产生运行维护报告,若发现故障,及时将故障转入故障处理流程。

(2)建立与用户的联系。在各级运行维护机构中建立集中接收用户运维请求的受理平台,用户可以通过电话、电子邮件、浏览器等多种方式将运维请求提交到受理平台。受理平台工作人员负责解答初级的运维问题,不能解答的转入故障处理流程。受理平台同时实现问题库的维护、解决情况反馈、解决方案查询等功能。

(3)故障处理流程。对受理平台不能解决的问题会转入故障处理流程。各级运行维护中心必须制定紧急事件的应急预案,对于重大故障启动应急预案,作出快速反应,迅速调动各方资源以排除故障、恢复系统,将故障对信息系统运行的影响降至最低。为高效、优质地完成故障处理,必须对可能出现的故障进行级别划分,根据级别的不同,确定相应的响应处理方式。应急响应处理方式有电话支持、现场解决、请求上级协助解决、与外界交流协作解决等。

(4)问题跟踪。该环节与故障处理环节同步,对故障处理环节中问题的处理过程进行记录,用户可以根据问题编号自行查询处理情况,该环节同时记录技术支持人员对问题处理的详细内容,供其他支持人员参考。问题跟踪环节中记录的信息将提供给运行维护知识库和决策分析系统。

(5)运行维护知识库。知识库管理人员对问题跟踪系统记录的故障解决方案进行整理、归纳,形成相关知识存入运行维护知识库中,便于今后需要处理相同或相似的问题时,支持人员能通过查询知识库及时获取解决方案。

(6)决策分析。决策分析环节通过对问题跟踪环节提供的问题处理时间、人工、花费、效率等信息的分析,按管理要求为管理人员产生分析报告,便于对支持体系结构和支持技能配备进行相应调整。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈