大数据平台数字化运营探索与实践.docx
《大数据平台数字化运营探索与实践.docx》由会员分享,可在线阅读,更多相关《大数据平台数字化运营探索与实践.docx(9页珍藏版)》请在第一文库网上搜索。
1、近年来,以大数据、区块链、云计算、人工智能等新兴技术为代表的金融科技如火如荼发展,创新应用层出不穷,深刻影响和重塑着银行的信息科技架构与数据资源运营模式,并促使银行内部管理和服务业态实现数字化转型。在此过程中,支持海量数据存储和高效计算的大数据技术作为其他应用的核心基础,为推动银行数字化转型提供了关键支撑,尤其在数据资源已成为金融行业重要生产要素的大背景下,数据规模以及大数据技术运用水平己然是银行核心竞争力的重要体现。一、数据服务质效提升面临的挑战现阶段,银行大数据服务平台建设大多借鉴国内外同业及互联网企业实践经验,通常是基于HadOoP生态技术组件(如HiVe、Spark、FIink等)以及
2、MPP-ShareNOthing技术架构平台(如Teradata、Greenp1umGaUSSDB等)构建,以支持PB级大规模海量数据的存储和计算。同时,银行内部业务数据与外部引入数据也被大规模汇集在大数据平台,以便于提供一站式融合数据服务,以及满足风险防控、客户管理、精准营销等各类决策分析和业务运营场景需要。在此基础上,业务场景以数据应用集市为体现形式,各类数据采集、加工处理以作业或任务为单位,数据作业调度系统依据海量作业之间的业务逻辑和先后依赖关系,最终形成了一个巨大的有向无环图(DAG)。然而,尽管大规模数据集成与共享带来了极大便利,但持续优化管理和质效提升仍面临巨大挑战。如今,随着银行
3、数字化转型深入推进,”业务数据化、数据业务化”及大规模数据集成与共享成为“新常态”,并促使大数据平台的总体数据量和数据分析类应用作业量迅猛增长,且接入系统和数据应用间关联耦合、盘根错节。在此背景下,大数据服务平台的重要性、数据集中运用的便利性口益凸显,而相应的问题和矛盾也逐渐显现。挑战1作业认知困境。随着作业量急剧增长,如何方便、快速、客观、全面地了解任意一个作业,包括运行属性、维护情况、业务场景、下游相关影响等内容,成为大数据平台在口常运维、故障处置等方面最为基础且迫切的需求。眺战2耦合关联困境。大数据平台汇集四面八方的数据,之后再进行集中贴源式存储或按主题模型整合,并会附带业务领域公共汇总
4、服务、数据应用间相互共享等机制,这一趋势推动数据分析类应用日渐丰富,却也极易造成系统和应用间深度耦合、故障异常产生关联影响以及数据加工处理链路过长等问题。对此,商业银行急需分析解耦、优化数据模型,并建立共享管理机制,但因缺乏常规、有力的工具和手段支撑,往往需要组织资深人员展开专项处置。眺战3时效提升困境。增强数据服务时效性既是引入大数据技术的初衷之一,也是其发展演进的必然要求,尤其当涉及某个具体业务的应用场景时,更需要确保上游整个数据加工处理链路端到端的时效优化和监控保障。但是,伴随系统应用间关联耦合、数据服务加工链路迅速增长,给数据应用的时效提升方案评估和监控保障带来极大困难。眺战4数据使用
5、困境。”找到想要的数据”是大数据分析建模、赋能业务的重要前提。特别是面对大数据平台中存在的海量数据表,如何快速透视一张表的数据血缘,了解其加工口径,是当前确认数据所需的关键环节。眺战5平台运营困境。面对数据应用众多且无法自主开展等难点问题,大数据平台面临巨大的运营压力,包括如何客观准确分析现状、减少对资深人员的经验依赖和主观判断、优化数据应用分布以及避免重复建设等,都已经成为急需解决的重要课题。在此背景下,常规的运营管理方式显然己无法满足大数据应用快速拓展和持续优化提升的需求,平台运营服务模式亟待改进。二、大数据平台数字化运营实践长期以来,大数据平台运维挑战的背景原因虽各不相同,但处理方式依然
6、有规律可循,即基于需求和问题,借助工具收集相关数据,经人工分析后再行解决。然而,随着银行数字化转型的深入推进,数据规模、作业数量、应用数量均迅猛增加,业务场景对数据服务质量和水平的要求也日益提高,传统的运维实践效率己无法有效应对新形势下的新挑战。对此,笔者团队借鉴客户经营领域的标签画像理念,创新提出了基于作业标签和应用画像的大数据平台数字化运营管理方案(如图1所示)。数据作业标签&画像设计方案(六类标签十五维评分)运行耗时衍生标签(量高、平均、方差)、链路圉及衍生标签(整体、内部、精简)、完成时间分布IO何斜率图1大数据平台数字化运营管理方案1数据应用画像框架结合实际运维及优化场景,笔者团队通
7、过对决策相关信息数据进行挖掘、筛选、归纳、整合,得出了一系列“语义化”和“短文本”标签,并最终形成了作业标签和应用画像。本文所述作业画像主要由六大类标签组成,包括基础属性、运行效率、业务影响、运行时效、数据血缘和资源消耗等,并就除基础属性外的五个方面进行了更高层次的量化评分。数据应用画像标签如图2所示。具体而言,数据应用画像是对应用集市级属性标签的归纳和集中展示,其从用户角度出发,力求直观反映基础属性、资源使用、应用能力、时效层级等情况,并透视数据应用间的关联耦合度。基于此,平台用户将可以通过画像对当前应用进行全方位了解,有效加快知识信息的交流、传播速度,并最大限度减少信息不对称问题。基本信息
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 平台 数字化 运营 探索 实践