一文读懂选择数据湖还是数据仓库.docx
《一文读懂选择数据湖还是数据仓库.docx》由会员分享,可在线阅读,更多相关《一文读懂选择数据湖还是数据仓库.docx(15页珍藏版)》请在第一文库网上搜索。
1、一文读懂选择数据湖还是数据仓库目录编者按11 .数据仓库、数据湖的概念和区别21. 1.数据仓库21. 1.1,数据仓库概念21.1.2.数据仓库特点21.1.3.O1TP-O1AP31. 1.4.数据仓库的作用41.2. 数据湖81.2. 1.数据湖概念81.3. 2.数据湖内容101.4. 3.数据湖的特点101.3. 对比111.4. 小结122 .揭穿关于数据湖和数据仓库的三大神话122.1. 只需要数据湖或数据仓库中的一个132.2. 数据湖是流行趋势,数据仓库不是人工智能132.3. 3.数据仓库易于使用,而数据湖很复杂133 .数据湖和数据仓库:用例144 .未来该如何选择14编
2、者按今天,每秒都在生成TB和PB的数据,为这些海量数据集寻找存储解决方案至关重要。复杂的机器和技术现在收集了令人难以置信的广泛数据一一每天超过2.5万亿字节!一来自设备传感器、日志、用户、消费者和其他地方。数据存储并不像以前看起来那么简单。在管理和存储数据时,数据管理者需要考虑使用数据湖或数据仓库作为存储库。随着数据量、速度和种类的增加,选择合适的数据平台来管理数据从未像现在这样重要。它应该是迄今为止满足我们需求的古老数据仓库,还是应该是承诺支持任何类型工作负载的任何类型数据的数据湖?在这里,我们深入探讨了这两个平台。1 .数据仓库、数据湖的概念和区别1.1. 数据仓库1.1.1. 数据仓库概
3、念数据仓库由比尔恩门(BiIUnmon,数据仓库之父)于1990年提出,主要功能是将企业系统联机事务处理(O1TP)长期壁垒的大量数据,通过数据仓库理论支持所持有的数据存储结构,做有系统的分析整理。底氮都鎏端擦理随着企业的发展,业务系统的数据不断激增,这些存储在企业业务数据库中(也就是关系型数据库OraC1e,MicrosoftSQ1Sever,MySQ1等)数据会随着时间的积累越来越多,会使业务数据库会有一定的负载,导致业务系统的运行效率低,且这些数据中有很大一部分是冷数据,而我们业务系统一般对我们近期的数据,也就是热数据调用的比较频繁,对冷数据使用频率较低。同时随着企业数据驱动业务概念的兴
4、起,企业需要将各业务部门的业务数据提取出来进行数据分析与挖掘,辅助高层进行分析与决策,但各部门需求的数据种类千差万别,接口错综复杂,过多的数据查询脚本以及接口的接入导致业务数据库的稳定性降低。为了避免冷数据与历史数据的积压对我们业务数据库效能产生影响,企业需要定期将冷数据从业务数据库中转移出来存储到一个专门存放历史数据的仓库里面,各部门可以根据自身业务特性对外提供统一的数据服务,这个仓库就是数据仓库。1.1.2.数据仓库特点数据仓库(DataWarehOeSe)的特点:面向主题的、集成的、稳定的、反映历史数据变化的。面向主题的:数据仓库是用来分析特点主题域的,所以说数据仓库是面向主题的。例如,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 读懂 选择 数据 还是 数据仓库
