为什么要做数仓分层.docx
《为什么要做数仓分层.docx》由会员分享,可在线阅读,更多相关《为什么要做数仓分层.docx(4页珍藏版)》请在第一文库网上搜索。
1、为什么要做数仓分层,不做行吗?01经典的数仓分层首先跟大家聊一个经典的数仓分层结构,主要包括ODS、DWS、DW、APP四层。APPDWDWSgODSssgODS:抽取的原始业务数据,结构一般和原始业务数据库表结构或者抽取的业务日志数据结构保持一致。一句话:从业务系统增量抽取,数据不做清洗转换,与业务系统数据模型保持一致。DWS:根据0DS层,增加一些维度信息,过滤一些异常数据。为DW层提供来源明细数据,提供业务系统细节数据的长期沉淀,为未来分析类需求的扩展提供历史数据支撑。DW:模型层,根据DM5层数据,按各个业务需求,以某个维度ID进行粗粒度汇总聚合。此层一般会根据数仓涉及的业务发展或者主
2、数据的建立等,抽象出一些公用的聚合汇总模型APP:应用层/指标层/报表层,每个公司的叫法不一样,一般指根据特定的某个应用或者报表进行的数据指标开发汇总。02数仓为什么分层那么为什么数据仓库会有分层呢?每多一层不就会多一些开发工作吗?还会经常有多层数据重复?不分层可不可以?也许上面这些问题会困扰你,可能还会有人说,我来公司的时候已经有开发规范了,不分层不行!其实数据仓库分层原因可以概括为以下4个方面:用空间换时间1、用空间换时间数仓的发展已经几十年了,在大数据技术出现之前,我们一般采用Oracle等一些关系型数据库来做数仓,但随着数据量的发展,特别是电信和银行业务的快速发展(那时候互联网企业还没
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 为什么 要做数仓 分层