数仓架构到大数据架构三个时代九种架构演进.docx
《数仓架构到大数据架构三个时代九种架构演进.docx》由会员分享,可在线阅读,更多相关《数仓架构到大数据架构三个时代九种架构演进.docx(19页珍藏版)》请在第一文库网上搜索。
1、数仓架构到大数据架构三个时代九种架构演进1 .数据平台的发展在悄然发生变化22 .一张图看清楚大数据架构发展23 .从数据到大数据的数据架构总结43.1 非互联网四代架构73.1.1 第一代edw架构73.1.2 第二代大集市架构83.1.3 1.3第三代汇总维度集市&CIF2.0数仓结构93.1.4 第四代OPDM操作实时数仓113.2 互联网的五代大数据处理架构113.2.1 第一代离线大数据统计分析技术架构123.2.2 第二代流式架构133.2.3 第三代1ambda大数据架构143.2.4 Kappa大数据架构153.2.5 Unified大数据架构173.2.6 IoTA架构173
2、.2.7 小结184 .大数据处理技术栈205 .DataMesh面向域的分散式数据架构211 .数据平台的发展在悄然发生变化从现在的企业发展来看,大家的诉求重点已经从经营与分析转为数据化的精细运营。在如何做好精细化运营过程中,企业也面临着来自创新、发展、内卷等的各方面压力。随着业务量、数据量增长,大家对数据粒度需求从之前的高汇总逐渐转为过程化的细粒度明细数据,以及从1的数据转为近乎实时的数据诉求。大量的数据需求、海量的临时需求,让分析师、数据开发疲惫不堪。这些职位也变成了企业资源的瓶颈,传统B1中的Report.O1AP等工具也都无法满足互联网行业个性化的数据需求。大家开始考虑如何把需求固定
3、为一个面向最终用户自助式、半自助的产品,来快速获取数据并分析得到结果,数据通过各类数据产品对外更有针对性的数据价值传递。(关于数据产品一个题外补充:当总结出的指标、分析方法(模型)、使用流程与工具有机的结合在一起时数据产品就此产生,随着数据中台&数据平台的建设逐渐的进入快速迭代期,数据产品、数据产品经理这两个词逐渐的升温并逐渐到今天各大公司对数产品经理岗位的旺盛诉求,目前这两方面的方法论也逐步的体系化、具象化)。在这十几年中,影响数据仓库、数据平台、数据中台、数据湖的演进变革的因素也很多,比如不断快速迭代的业务模式与膨胀的群体规模所带来的数据量的冲击,新的大数据处理技术的驱动。还有落地在数据中
4、台上各种数据产品的建设,比如工具化数据产品体系、各种自助式的数据产品、平台化各数据产品的建设。这些数据建设能力的泛化,也让更多的大众参与数据中台的建设中,比如一些懂SQ1的用户以及分析师参与数据平台直接建设比重增加。还有一些原本数据中台具备的能力也有一些逐步地被前置到业务系统进行处理。2 .一张图看清楚大数据架构发展数据仓库在国外发展多年,于大约在1998-1999年传入中国。进入中国以后,发展出了很多专有名词,比如数据仓库、数据中心、数据平台、数据中台、数据湖等,从大数据架构角度来看可用三个时代九种架构来做总结,其中前四代是传统数据仓库时代的架构,后面五代是大数据架构模式。其中有两个承前启后
5、的地方:一个特殊地方是,传统行业第三代架构与大数据第一代架构在架构形式上基本相似。传统行业的第三代架构可以算是用大数据处理技术重新实现了一遍。传统行业第四代的架构中实时部分在现代用大数据实时方式做了新的落地。如下图所示W1仓N-代兼用r,1w传求NJt仓房二代兼用HHSt仓属,三代*科构(Ut令序NV-/-左用大H1t事五代象内 04-PU-P1-P*-fi4,04-mp3Btw-ag.由出加s O-PUD-P1.ST(APfQ-友用三个时代:非互联网、互联网、移动互联网时代,每一种时代的业务特点、数据量、数据类型各不相同,自然数据架构也是有显著差异的。行业域非互联网互联网移动互联网数据来源结
6、构化各类数据库Web、自定义、系统的除了互联网那些外还(相对于数(DB系统)、结构化日志,各类结构化DB含有大量定位数据、据平台来文本、Exce1表格数据、长文本、视自动化传感器、嵌入讲)等,少量WOrd频主要是来自式设备、自动化设备网页等数据包含信CRM客户信息、事务除了传统企业数据除了传统互联网的数息性ERP/MRPII数信息外,还含有用户据外,还含有Gps、穿各类点击日志、社交戴设备、传感器各类据、资金账务数数据、多媒体、搜索、采集数据、自动化传据等。电邮数据等等感器采集数据等等数据结构特几乎都是结构化数非结构化数据居多非结构化数据居多性据数据存储/主要以DB结构化存文件形式、DB形式,
7、文件形式、流方式、DB数据量储为主,从几百兆到流方式、从TB到PB范式,非结构化从百G级别TB至IJPB产生周期慢,几天甚至周为单秒或更小为单位秒或更小为单位位对消费者行粒度粗粒度较细粒度非常细为采集与还原数据价值长期有效随着时间衰减随着时间快速衰减3.从数据到大数据的数据架构总结我自己对传统数据仓库的发展,简单抽象为为五个时代、四种架构(或许也不是那么严谨)。五个时代大概,按照两位数据仓库大师Ra1phkiImba1KBi11Innmon在数据仓库建设理念上碰撞阶段来作为小的分界线: 大概在1991年之前,数据仓库的实施基本采用全企业集成的模式。 大概在1992年企业在数据仓库实施基本采用E
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 架构 数据 三个 时代 演进