面向分布式转型的异构系统运维管理平台建设.docx
《面向分布式转型的异构系统运维管理平台建设.docx》由会员分享,可在线阅读,更多相关《面向分布式转型的异构系统运维管理平台建设.docx(7页珍藏版)》请在第一文库网上搜索。
1、近年来,面对国际形势变化以及互联网企业架构带来的启发,商业银行纷纷开启分布式转型,同时其信息系统架构也呈现出集中式与分布式并存的特点。在此趋势下,IT运维团队不仅要继续承担传统集中式大型主机平台平稳运行的运维职责,又要做好未来分布式运维的技术储备,尤其在大型主机技术相对封闭、向分布式技术栈迁移难度较大的情况下,如何顺利实现运维技术转型成为当前面临的重大挑战。与此同时,在集中式和分布式并存的复杂架构下,只有让运维能力具备与运维对象松耦合的可迁移性和普适性,才能更好地适应银行信息系统技术不断更迭的现状和趋势。针对上述变化,笔者团队以多年积累的运维经验为基础,总结提炼了分布式运维管理方法论,并配套搭
2、建异构系统运维管理平台,创新开展了以数据统一采集与标准化治理为基础支撑、以标准化产品组件为控制接口、以即插即用的工具平台为共享服务、以运维需求为应用场景的落地实践,逐步推动运维模式从“事件驱动”向“数据驱动”转变,推动平台建设从“需求功能实现”向“通用运维能力沉淀”转变。一、异构系统运维管理平台架构设计面向分布式转型趋势,笔者团队将新技术手段与管理流程优化相融合,着力推动以数据驱动的智能运维体系建设,并创新搭建了异构系统运维管理平台(如图1所示)。该平台基于多维度运维数据,在屏蔽底层运维对象复杂性的基础上,重点实现了标准化数据治理与规范化接口调用,旨在迭代推动运维模式向可视化、自动化和智能化转
3、型。平台设计重点强调了三项基本原则:一是相对独立,即将复杂的运维能力建设拆分为相对独立的服务建设,通过规范接口,实现平台间、模块间的相互调用协作;二是能力复用,即使每一个开发过的功能模块在之后的能力建设中能够被最大程度被复用,进而降低成本、缩短时间,实现乘数效应;三是闭环设计,即通过将人的能力和机器的能力统筹考虑,最终实现数据、分析、决策、处置的操作闭环与事前、事中、事后的流程闭环,并借此持续推进自动化、智能化转型。图1异构系统运维管理平台架构设计基于上述原则,异构系统运维管理平台重点打造数据治理、控制接口、共享服务、应用场景等四大功能模块,并在其中内嵌了“数据驱动、预防为主、应急为辅”的预防
4、性维护闭环流程。其中,数据治理功能重在实现对异构运维对象数据的统一采集、存储、归总,控制接口功能重在实现对异构运维对象的统一控制操作,共享服务功能重在将常用的数据分析服务集成为通用工具,应用场景则是指根据事前、事中、事后的应急闭环迭代流程落地具体的运维场景,并以统一门户全景展示异构运维对象的实时状态。1 .数据治理模块异构系统运维管理平台的运维对象涉及大型主机平台、A1X平台、X86平台等多个并存的异构系统,每天有大量源数据存储需求,数据的类型、格式也千差万别。对此,笔者团队首先在数据治理模块中搭载了数据字典,并据此标准化数据采集工具,最后基于数据仓库统一存储的治理策略,搭建了主机性能容量平台
5、(TDS)、大数据平台(BIGDATA)、配置管理数据库(CMDB)三大平台作为数据治理的主要抓手,建设标准化的平台数据资源池。以主机性能容量平台为例,该平台重点实现了对主机性能指标(SMF)数据的统一结构化存储与管理。实践中,TDS首先是按照系统、存储、数据库、交易中间件、消息中间件、批量等组件划分方式,分条目建设性能指标体系,再基于指标体系抽取了685个常见的性能指标作为采集对象,每一类组件设计有单独的采集解析脚本,收集数据互不影响,且采集的数据会统一落入DB2和MySQ1数据库。在此基础上,作为支持上层应用的数据资源,该平台还重点搭载了三个典型应用:第一部分是系统的健康检查,帮助运维人员
6、快速掌握系统运行状态,发现潜在的性能问题;第二部分是关键指标的容量预估,通过分析指标的长期变化趋势,提前预估基础环境中的容量问题,做好容量规划,保障生产资源的弹性扩容;第三部分是事后问题诊断,通过对底层多维度的指标关联挖掘,平台集成有波动分析、趋势分析、对比分析等多个分析模型,用于根因的快速分析定位。2 .控制接口模块为实现对异构平台的统一自动化调用,控制接口模块中搭载了中国银行自主研发的自动化运维管理平台一一MOMAoMOMA通过将常见运维操作进行标准化打包,可实现对异构运维对象的统一控制,并基于工作流编排、调度和交互控制等功能,支持用户在网页端定义一系列相互关联的指令作业,并按照事先约定的
7、执行流程进行自动执行与实时追踪,从而实现一套流程、集中控制、重复使用,显著降低了管理成本和差错率。MOMA平台通过标准化接口实现主机平台和开源平台对接,彻底改变了主机平台的闭源特性,使传统主机平台拥有了丰富的可视化界面。同时,在变更任务的拆分过程中,通过开发大量能满足平台接口调用规范的主机平台作业流,全面覆盖了自动化控制、智能判断等功能,并共同组建了主机自动化运维脚本库。未来,伴随着MoMA平台的演进和发展,主机平台的自动化运维能力也将不断提升,而主机接口标准化建设则为异构运维对象的集中自动化调度铺平了道路。3 .共享服务模块基于相对独立和能力复用等设计原则,共享服务模块作为对接数据与应用的通
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 面向 分布式 转型 系统 管理 平台 建设