伴随着云数据中心、大数据、移动化等新技术的兴起,数据中心建设者和运营管理者需要利用新的技术去改变传统方式,在追求能耗与成本平衡的同时,还需要不断提升运营服务质量、实现数据中心高效安全生产。在这种转变过程中,数据中心运维管理呈现出以下五大趋势。
趋势一:“两地三中心”向“分布式多活”发展
传统数据中心按照“本地数据中心、同城灾备中心、异地灾备中心”的管理模式构建了“两地三中心”,以数据中心为生产中心,与同城灾备中心、异地灾备中心实现无缝对接,涵盖了生产运行各个层级和节点,保障了数据中心安全生产和业务连续性。但在实施该管理机制过程中,无论在制度、流程,还是在技术、人员方面都对数据中心运营管理者提出了较高要求。而分布式多活数据中心是将业务分布到多个数据中心,彼此之间并行为客户提供服务。
这种转变要求数据中心管理者进一步推进管理的标准化和精细化,提升数据中心自动化和可视化水平,打造并实现多数据中心的一体化运维体系。
趋势二:数据中心基础设施管理和IT管理将加速融合,密不可分
传统数据中心的IT管理和基础设施管理,通常处于独立操作且并行的状态。但事实上,对于运行良好的数据中心而言,无数运行的部件相互连接,基础设施组件是支撑整个数据中心高效、低碳、绿色运行的关键部件,因此,应使用一个集成的数据中心管理解决方案来有效地管理整个数据中心。
趋势三:“云化”驱动数据中心的全面自动化管理
伴随着云数据中心和软件定义环境等新技术的兴起,数据中心将承载着数以百万的连接、快速增长的数据和不断变化的工作负载。具体来说,在“数据计算”方面,单位成本计算力不再是唯一衡量因素,衡量指标从单位成本计算力扩展为每瓦计算力、每平方米计算能力等,数据中心的运营者们需要在计算能力、存储密度、能源效率等因素之间寻求新的平衡;在“数据存储”领域,数据中心由纵向扩展慢慢迁移为横向扩展;而在“数据交换”方面,数据带宽不再依赖于硬件和网络架构的限制,随着软件定义网络渐渐成为趋势,数据中心可以像升级或安装软件一样对网络架构进行修改,满足企业对整个网站架构进行调整、扩容或升级,同时底层交换机、路由器等硬件则无须替换,节省大量成本的同时,网络架构迭代周期将大大缩短。
然而数十万规模的服务器群伴随着大规模网络难以统一集中管理、维护运维效率低等问题,同时如何根据业务发展进行灵活组网、虚拟机部署迁移、高质量满足业务部门的SLA要求都将给数据中心管理者带来不小的挑战,单独依靠人的运维方式已经远远不能适应云化数据中心“敏捷、随需交付”的特性。
趋势四:开发运维一体化(DevOps)打通业务敏捷的最后一道关卡
DevOps是软件开发生命周期(SDLC)从瀑布式到敏捷再到精益发展的要求。De⁃vOps超越了敏捷,它的关注点是从SDLC中移除浪费。通常情况下,发现浪费或者瓶颈的形式包括:不一致的环境,人工的构建和部署流程,差的质量和测试实践,IT部门之间缺少沟通和理解,频繁的中断和失败的协定以及那些需要珍贵的资源、花费重要的时间和金钱才能保持系统运行的全套问题。
从产品到服务的转型也同样影响着软件交付。以前,开发公司完成软件产品后,就直接交付给用户去负责运营。而随着云计算的到来,大部分公司在构建软件的同时,也负责为客户运营该软件。如果云是个乐器,那么DevOps就是演奏该乐器的音乐家,两者一起促进IT完成一项重要转变:从询问“我们在崩溃前还能坚持多久?”到“我们多久可以提交一个新功能?”或“我们能多快部署一个新服务?”。
同时对于数据中心自身而言,随着软件定义环境技术的逐步落地,数据中心本身也将成为一套软件,需要考虑如何保证这个软件能够持续快速改进,并满足前端新服务的部署要求。(www.xing528.com)
相对于数据中心以往使用的基于ITIL标准进行IT运维管理而言,DevOps提倡开发和IT运维之间的高度协同,从而在完成高频率部署的同时,提高生产环境的可靠性、稳定性、弹性和安全性。这种协同需要围绕ITIL变更、配置和发布管理流程实现高度自动化。举例来说,对于传统的应用系统发布,需要实现应用系统从开发、测试、生产环境间进行自动迁移,包括操作系统安装配置、中间件数据库安装配置、安全规则设置、应用部署、集群部署、监控/备份等管理软件部署、配置自动化收集和记录等工作。同时,DevOps要求在不中断和破坏当前服务的基础上,确保业务能部署成功,同时也可以快速检测和修复缺陷。
应用DevOps前和应用DevOps后的变化,如图14⁃9和图14⁃10所示。
一个典型的DevOps环境除了在人员组织架构上更好地融合开发团队和运维团队外,在技术上需要通过一系列自动化工具、流程化工具进行高密度的整合,如图14⁃11所示。
图14⁃9 应用DevOps前
图14⁃10 应用DevOps后
图14⁃11 典型DevOps环境
趋势五:大数据时代下的数据中心运维向智能化的大数据运维(ITOA)转变
麦肯锡公司对“大数据时代”做出这样的定义:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”如今,大数据正在从专注于个别项目向对企业战略信息架构的影响上转移,对数据量、种类、速度和复杂性的处理正迫使许多传统方法发生改变,为数据中心管理者带来前所未有的难题,随着企业IT架构的不断扩展,服务器、存储设备的数量越来越多,网络也变得更加复杂,同时云化数据中心趋势进一步加速了数据中心管理对象的数量级和复杂度。
对于金融、政府、互联网等超大的数据中心,原有的运维思路和运维方法已难以满足其海量数据计算、存储、应用和安全等多种职能的需求。一方面是成千上万台IT设备以及各种软件系统;另一方面繁多复杂的业务应用,数据中心需要借助先进的自动化运维管理模式来实现大体量系统管理。对于数据中心管理者而言,需要进一步做好质量和效率之间的平衡,加速从自动化运维向智能化运维进化,借助机器学习预测并发现故障、跨域故障关联、自动进行故障隔离、故障解决。同时,通过故障语义分析、运维关键词识别、解决方案关联搜索、解决方案识别等技术实现知识管理的自动闭环。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。