数据中台数据管控体系简明教程.docx
《数据中台数据管控体系简明教程.docx》由会员分享,可在线阅读,更多相关《数据中台数据管控体系简明教程.docx(11页珍藏版)》请在第一文库网上搜索。
1、数据中台数据管控体系简明教程大数据、数据治理、数据湖以及被热议的数据中台概念,无不让企业信息化部门疲于跟进,而不是根据企业的实际情况决定建设节奏。企业A的TT部门,就曾受到“业务部门要求建设数据中台”的压力,但迟迟难以下决心启动数据中台项目。从A企业的视角来看,目前,行业内缺少有说服力的数据中台成功案例,陆续有媒体曝光一些大型企业投入巨大,但是也没有产生较好的效果,这更是让A企业IT部门觉得数据中台可能只有部分大型互联网企业才能取得非常积极的效果。经过分析讨论,A企业TT部门认为,业务部门并不是一定要需要所谓的“数据中台”,而是需要一个响应迅速的数据访问和加工处理服务。那么如何构建一套业务数字
2、化发展所需要的数据服务体系呢?01传统数据管控体系的五个挑战一年前,该IT部门曾经启动过业务数据湖集中管理项目,最后以失败告终。事后复盘,该IT部门认为失败的主要原因在于两个方面:1、很多业务部门以各种理由拒绝将主要业务应用系统的数据分享出来,理由千奇百怪;2、IT部门对于建设数据湖后到底能在哪些业务场景如何应用难以给出有说服力的实例。TT部门,包括应用需求管理和开发部门,并不深入了解业务场景,无法提出数据集中的应用场景说服业务部门共享数据。最终,在采购了一堆存储硬件和软件后,宣称所谓的“数据湖”系统上线,但是里面基本上没有重要的业务数据。近年来,数据的价值越来越被重视,甚至被经济学家认为是和
3、人、设备、土地、资本一样的重要生产要素,数据资产被形象比喻为数字时代的“石油”。将数据类比石油,可以发现一些有益的启示。石油产业价值链已经历了数百年市场化演进,从原油勘探到成品销售的价值变现过程,由上游、中游、下游的多个产业环节、数以万计的公司通过技术、运营、管理、交易等复杂的活动来完成,产业链分工明确、相互协作,不是仅靠单一的技术系统来实现,可以说,石油产业价值链是具备超强效率与变现能力的最佳实践参考。企业内部的数据价值链与石油价值链具有明显差距,如下图所示:石油产业价值链上游中游勘探开采运输仓储燎制下游中间品销iT成品加工成品销售II Xi数据架构 数据采集数据传输数据仓储- 跤据中合 m
4、. 欺密架构设计基于接口和SB本 基子脚本 NP及其变种源海据摆件欧敬文数据资产价值链数据服务 /) 原总 /数据消费 业务应用场景遗侦、石丁商业科技观察石油/数据价值链对照传统数据管控体系大多数是建立在技术栈基础上.,业内比较领先的数据管理技术栈如下:数据中台数据架构治理数据湖部门AU)传统数据管控体系数据源:数据大部分都散落在由不同的(业务)部门、不同的团队建设和运维的应用系统中。数据湖:通过数据湖、数据仓库等技术手段,将不同系统中的数据进行集中管理。数据架构治理:通过制定数据架构、数据标准、元数据管理等,降低数据交换的难度。数据中台:为数据的进一步加工处理提供平台和通用技术功能支持,提供
5、数据的进一步分类和聚合,屏蔽数据源访问差异。从技术上来看,当前的数据技术栈可以较好支持数据的获取和加工,但是任何价值的实现都不是仅靠技术能够独立实现,正如同石油资产,没有良好的管理运营体系支撑,最多只能是开采后保存在仓库的原料,消耗了技术设施投资,难以变成企业的业务收入,更难于构建一个有良好利润和现金流的业务模式。当前基于数据技术栈的企业数据资产管理体系存在着诸多挑战。比如,难以解决组织竖井壁垒的难题。在企业内部,虽然数据的所有权名义上属于整个企业,但是执行上,数据的开放和共享会遇到应用系统管理团队和业务部门的隐形障碍,数据需求部门往往最终很难及时拿到自己想要的数据,最后不了了之。最终,数据中
6、台也好、数据湖也好,都只是搭建了一个技术系统,但缺乏高价值数据的导入和输出。即使能够解决数据的共享和输出问题,“铁路警察一一各管一段”(这可能是数据管理实践中的另外一种真实写照),没有人对数据整个处理流程负有责任,数据处理过程不能有效衔接,质量和时效性难以保证,出了问题回溯分析也非常困难。过去数据仅限于单个.业务或职能小范围使用,如今多数据的联合分析需求已经扩展到企业的各个层面,低劣的数据质量危害将放大到整个企业。但技术团队没有被赋予端到端质量管理的职能,很多时候也没有能力和意愿进行管理。传统数据管控体系还缺乏支持数据高效流动和处理编排的工具。这个工具与目前热议的“数据中台”不同。目前数据中台
7、是一个十分混乱的概念和实践,其目的是希望将企业所有数据进行跨部门、跨业务、跨系统的集中,建立数据主题库,对数据进行加工分析,因此数据中台只是被动解决数据集中问题,没有将数据的共享和交换作为一个基础平台来开发和实现,其结果是在数据流动层面还是基于个体的、定制的开发。H前的数据技术栈,对于构建统一的数据流动管道和处理流水线,普遍还缺乏重视和实现;很多实践还停留在基于脚本、基于定时、基于手工的管理模式,没有实现数据的管道化高效流动和流水线化编排处理的架构和管理模式,效率低、风险大,难以支持数据的及时变现,支持业务运营和创新要求。而石油产业为了提升整个产业链的效率,一个最重要的方法就是搭建跨公司、跨地
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 体系 简明 教程