京东零售数据仓库演进之路.docx
《京东零售数据仓库演进之路.docx》由会员分享,可在线阅读,更多相关《京东零售数据仓库演进之路.docx(16页珍藏版)》请在第一文库网上搜索。
1、京东零售数据仓库演进之路导读:京东零售十年交易额快速增长的背后,不仅是京东零售高速发展的十年,也是数据仓库技术架构演进创新的十年,EB级数据如何进行资产化沉淀和治理?如何支撑业务高速发展、精细化运营、规模化创新的不同阶段?在未来更加复杂多变的环境下,将如何持续演进?作者:尹翔编辑:老鱼今天的分享主要分为以下三个部分。第一部分:首先回顾一下大数据在国内的发展历程第二部分:介绍随着京东的快速发展,大数据在内部经历的几个主要阶段第三部分:京东零售数仓核心能力和场景实践01大数据在国内的发展历程大数据的发展,大体来讲可以分为三个阶段:t DICC2CB1中国就鬣座技术大会I大数据演进历程中台资产依服务
2、化用件化.”帼化flUEBl套件大敌窜哈HadoopChMUnfl第一个阶段,2010年之前,是企业级数据仓库的时代,也叫EDW,以关系型数据库为主。当时Oracle、Teradata等传统软件厂商占据了大部分市场,基本上提供了数据仓库建设从硬件、软件到实施一体化的解决方案,建设成本非常高,当时主要集中在金融、电信、保险等行业,数据仓库的主要应用场景是提供报表,用于经营决策。第二个阶段,大概在2010年前后,随着移动互联网的高速发展、数据量暴增,很多互联网公司开始基于Hadoop生态搭建大数据平台,来应对大数据量的处理。数据应用的场景也更加丰富,比如互联网广告、精准营销、供应链管理、abtes
3、t等第三个阶段,大概从5年前,也就是15、16年前后,业界开始提出数据中台的概念,通过大中台、小前台的模式,驱动业务创新和提效。数据中台组件化、智能化的方式,将通用的数据开发场景和工具进行沉淀,来提升开发效率,再通过数据的资产化、服务化的方式提升业务数据使用效率,让业务更加聚焦在数据应用和业务创新卜.,而不是花费大量的精力进行数据能力的重复建设应用层服务层赢例 一:数嘱陀/j iHRwn J ( 裤能决雉 ):b唔.aad而平台层瞭费平彳f言初平.戴仓于台EH1(屣而嬴存储计菖层I多维分析F :RSpark StreamingStorm管理中心数据目录数据质量JHOPS Hbase/Allux
4、io)1KafkaScribeDauXFlume传输层H B5,造,朴东即席童闻 二多堆分析:至诿工 (元.壶熬从数仓的视角下,来看数据中台的技术架构,是伴随着数据的采集、存储、计算、管理、应用这些环节延展开的。从这里可以看到,数据中台的技术生态是非常复杂的,这里涉及到非常多元的技术和产品,而且这些技术也在高速发展阶段,每年基本都会涌现大量的新产品和技术,这些特点就给企业实施数据中台带来了很高的技术门槛,如果技术路线不清晰,很可能会造成很大的风险和隐患。02京东零售大数据的发展历程我们回顾京东零售大数据的发展历程,也经历了几个重要的阶段,从最开始的野蛮生长,到后来的精细化运营、以及现在的数据驱
5、动业务,从过去的大数据平台阶段也升级到了现在的数据中台阶段。百家争鸣平台*需求舞动解决编点-吻越场景化廊房*规楂化总绘数据驱动百花齐放中台I京东零售大数据发展的几分阶段c A PICC2C21中国数婚岑技本大告ChinaUmM bfJB第一阶段,在17年之前,是野蛮生长的阶段。当时的特点是烟囱式开发,业务发展很快,靠中心化的团队很难支撑所有业务需求,因此在大数据平台之上,每个业务线需求都是闭环的数据团队在支持。但到后来这种烟囱式开发,导致了数据不互通、重复造轮子、研发效率低的问题,光数据集市就卜.百个,相似的数据产品也有非常多,占用了大量的存储和计算资源,数据口径也无法对齐,内部沟通和管理成本
6、变得很高。于是就到了第二阶段,在17、18年开始精细化运营,建设数据中台,打通各集市间的数据,更加注重数据资产的沉淀,也开始围绕业务场景,去搭建场景化服务的能力,去支撑业务的精细化运营场景。第三阶段是数据驱动业务的阶段,也是现在我们所处的阶段,精细化运营可以看作是专家经验的沉淀,中台也在考虑怎么进一步释放产能,降低研发门槛,以智能化的方式进行数据生产、管理和应用。比如低代码的开发平台,以及像智能选品和用户增长这些应用。以上,我们简单回顾了一下京东大数据发展的几个阶段。DTCC2E21中国裁鬣鹿技术大会03京东零售数据仓库建设实践京东零售数据仓库建设京东零售全域数据资产体系:源于业务,沉淀资产,
7、创造价值全域数据资产全链第业务场最沉淀由用流Hi商品财务交易供应链经过这些年,目前在数据中介已经沉淀了覆盖京东全链路业务场景的全域数据资产。我们基于对零售业务的深度理解,将业务场景抽象成数据模型体系,来描绘业务之间的关系,同时也会考虑到如何存储、计算、管理这些数据,这些都非常考验数据中台团队的业务能力、技术能力和数据治理能力。最终我们将沉淀的数据资产,应用到全链路的业务场景中,比如用户增长、营销策略制定、供应链管理、仓储布局规划、配送路径规划等等,在这些场景中得到验证和反馈,形成正向的循环,不断地将数据资产体系建设得更加完善。I数仓面临的挑战DTCC2G81中OBUtlH度技术大会01烟0:开
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 零售 数据仓库 演进