分布式存储在数据治理场景中的价值.docx
《分布式存储在数据治理场景中的价值.docx》由会员分享,可在线阅读,更多相关《分布式存储在数据治理场景中的价值.docx(12页珍藏版)》请在第一文库网上搜索。
1、分布式存储在数据治理场景中的价值【摘要】本文通过对分布式存储的发展路径、架构类型、分布式理论,以及在数据治理场景中的实践进行阐述,探讨分布式存储技术在数据治理体系中发挥怎样的价值。引言随着信息技术呈现井喷式发展,尤其以数字经济为代表的IT新基建将成为新经济的发展动能。同时以云计算、大数据、人工智能、区块链等为代表的数字技术不断涌现,快速向各领域进行融合渗透。在技术导向更为明显的今天,以数据为核心的数字化转型已是大势所趋。在笔者所在的金融领域,更是数据密集型行业,无论在企业经营的方方面面,所积累的海量数据资源,通过对这些数字资产进行管理、应用、治理,并运用到内部管理、过程优化、业务运营和数字反馈
2、等多个领域。在本篇文章中,通过对分布式存储的发展路径、架构类型、分布式理论,以及在数据治理场景中的实践进行阐述,一起探讨分布式存储技术在数据治理体系中发挥怎样的价值。一、新数据时代存储所面临的挑战随着人脸识别、人工智能、AI安防、物联网、5G等新技术新业务的快速应用,使得数据的增长飞速发展。传统存储系统的集中式架构,导致在扩展性上无法满足数据增长需求。另一方面,随着新业务的应用,性能需求也将越来越高,容量与性能的双重增长,导致存储系统面临新的挑战。1、存储扩展能力有限在新数据时代,数据的高速增长成为主要特性,存储的扩展性成为重要考虑指标之一。传统存储采用集中式架构,存储的扩展性受制于控制器性能
3、,无法提供有效的高扩展能力。另一方面,在传统存储架构中,数据处理均依靠控制器能力,因此,在海量数据的处理上更是难以承载。2、硬件封闭,管理复杂传统存储是个黑盒子,设备管理和数据应用均无法提供可视化操作,在业务数量越来越多,数据应用越来越复杂的今天,无可视化操作的管理系统给运维带来很大的难度。例如1UN与主机的映射关系管理、1UN的性能、容量规划管理等都需要一对一的调整、管理。无形中增加了管理难度,提升了运维成本。3、数据孤岛,数据难共享利用数据的价值在于利用,传统存储系统常常做到了数据存的作用,但针对数据的管理和利用往往差强人意。目前数据中心一般都有几十个到上百个业务系统,不同业务系统对存储的
4、需求和使用方式都不一样,比如用户数据库业务系统需要有高IOPS的块存储服务,广电用户非线性视频编辑、医院PACS系统需要大容量大吞吐的文件存储、对象存储等等。存储系统独立建设,从而形成数据孤岛。对于共享数据型业务系统建设或大数据业务建设必须继续重建独立基础架构。重复投资,架构复杂,回报率低下。4、可靠性不足传统存储虽然封闭式独有硬件设计,但在一个引擎情况下,虽然内置两个控制器,在引擎层面依然存在单点故障风险。在数据冗余方面,传统存储架构通常采用raid冗余方式,通过热备磁盘的方式作为损害磁盘的替换方案。但raid的数据重构,往往需要整个raid组的所有磁盘参与重构,从而导致重构的速度很慢而且性
5、能影响较大。如果此时此raid组再次发生磁盘损坏,数据丢失一定会发生。因此,在可靠性上依然差强人意。二、分布式存储解决之道分布式存储采用分布式架构,利用标准x86服务器构建存储资源池,消除了专用硬件的依赖性,并提供块、文件、对象等多种存储服务。此外,分布式架构实现了多节点高并发业务处理,每一个节点都有数据存储和处理能力,所以整个平台具备更高性能和更高可靠性,能够同时满足数据库等结构化数据高IOPS需求和视频、图像等非结构化数据高吞吐需求,如下图所示。三、分布式存储的产品价值1、灵活扩展满足海量数据存储需求分布式存储系统,采用SCa1e-OUt扩展架构,可实现超大集群规模的部署,从3节点存储集群
6、起步,可实现灵活的扩展至数千节点。存储容量可实现一个集群EB级数据空间。同时由于分布式架构,每一个存储节点都可以提供独立的性能支撑,在高并发的数据处理中,可以实现更高的存储性能,更高的带宽吞吐和IOPS。有效的解决海量数据高扩展和高性能的存储需求。2、弹性扩容与替换由于实现了分布式存储平台,那么此平台无论多少个节点都可以看作一个资源池,每一个节点可以看做这个资源池的一个分子。通过系统预装、软件优化可直接将分子加入到整个平台之中,因而,在存储性能或者容量资源不够时,均可以通过添加硬件资源来提升存储集群的相应资源。另一方面,由于硬件采用标准化X86服务器,并且集群内每个节点均通过软件系统进行统一管
7、理,在硬件设备老旧或者故障时,可便捷的直接更换新硬件,加入集群中。简单方便并且对于上层业务无感知。友善的提供产品更替。并且,更替节点或者磁盘后,存储系统将会进行自动重建数据,平衡各节点的数据分布。此操作无需人工干预即可自动完成。降低使用难度。3、可视化、标准化让管理更简单相较于传统存储黑盒子的管理方式,分布式存储实现了标准硬件的交付,标准硬件服务器的运维管理会更简单。在存储生命周期过程中的管理具备以下优点。部署上线:存储节点内置与硬件深度优化后的存储系统,30分钟即可实现部署上线。告别传统的软件部署安装,调优适配,真正实现了开箱即用。配置规划:按照系统指示,实现资源分配和管理。资源配置可实现灵
8、活的分配和回收。配置规划全部可视化操作,无需人工手动记录对应关系,一切均可直观使用管理。管理运维:直观的可视化管理设计,可实现全集群的一页管理。硬件的cpu、网络、磁盘等健康监控,到逻辑卷、用户数、存储集群的稳定运行情况均可动态展示,做到实时监控预警。故障排查:故障排场从传统的故障告警实现了提前预防。分布式存储可实现集群的健康监测,在故障潜伏期即可实现故障提醒。真正实现故障的提前处理,防患未然。4、统一存储资源,实现数据共享共用分布式存储系统通过统一硬件资源池,同时提供块、文件、对象三种存储服务。因而,数据中心的数据将统一存放到云存储资源池中。通过存储管理系统,可根据用户指令实现数据的调动与共
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分布式 存储 数据 治理 场景 中的 价值
![提示](https://www.001doc.com/images/bang_tan.gif)