数据领域趋势解读之数据编织.docx
《数据领域趋势解读之数据编织.docx》由会员分享,可在线阅读,更多相关《数据领域趋势解读之数据编织.docx(7页珍藏版)》请在第一文库网上搜索。
1、数据领域趋势解读之数据编织摘要2一、数据编织产生的背景2二、什么是数据编织3三、数据编织与数据中台、数据治理、DataOPS的关系43.1 数据编织与数据中台53.2 数据编织与数据治理53. 3数据编织与DataOps6四、数据编织将如何发展64. 1回归数据资源化和服务化的本源74.3关注与物联网和边缘计算的深度融合7小结8摘要最近在日常的工作和跟客户的交流中,频繁谈及“数据编织”这个词,开始关注数据编织是源于对主动式数据治理和数据编排的研究,从现在的趋势来看,数据编织显然已经进入落地阶段。数据编织正在从一个概念、一个理念向一线生产场景演进,正在加速产品化和实战化。其实数据编织不是一个特别
2、新的词,Gartner在2023年的重要战略技术趋势报告里面,第三次把数据编织列为十大技术趋势之一。“数据编织”一词高频出现,似乎已经进入落地阶段,本文介绍了数据编织产生的背景及其定义,详细分析了数据编织与数据中台、数据治理、DataOps的关系,以及未来数据编织发展的方向和需要关注的问题。一、数据编织产生的背景首先我们来看一下在数据领域正在发生着哪些趋势性的变化。1、数据成为核心生产要素,成为数字化转型不可或缺的重要元素。随着政策的加持,大家对数据要素重要性的认知也越来越充分,企业数据总量不断增加,但是数据孤岛的情况没从根本上得以解决,反而有变本加厉的趋势。2、数据结构从结构化向多元化方向进
3、一步演进。数据的内涵和外延都进一步发展,从单纯的结构化数据为主,向包含结构化、半结构化和非结构化数据在内的混合模式转移,数据采集、使用、管理的难度进一步加大。3、从单纯关注数据应用到关注数据能力体系化建设。数据域的建设正在从单纯的以数据应用为核心,向体系化的数据服务能力建设转型,开始意识到数据管理和运营的不足,开始尝试数据服务能力平台化和体系化,开始探索改变数据治理“一乱一治”的被动局面。4、数据运行环境呈现跨平台和融合化的趋势。随着企业上云开展和多云架构的广泛采纳,数据运行环境正在加速融入统一的云化基础设施中,数据采集、存储和分析正在从离线转向实时,对目前异构、泛在、智能的算力平台提出了更高
4、的要求。以上这些趋势性的变化,都是在实际生产中遇到的数据管理的难题和痛点,企业需要一种新的数据架构理念来应对在数据资产化进程中产生的复杂性、分布式、多元化等因素,于是数据编织出现了。二、什么是数据编织对于数据编织的定义,业内尚且没有统一完整的表达。Gartner给数据编织(DataFabric)的定义如下:DataFabricisadesignconceptthatservesasanintegrated1ayerofdataandconnectingPrOCeSses.数据编织是一个设计概念,表示数据和连接进程的集成层。从以上的定义可以看出,Gartner首先认为数据编织不是一种技术,而是一
5、种设计理念或者叫一种架构理念,然后认为数据编织是一种跨平台的数据整合手段,同时具备数据和连接两个核心概念,数据既是编织的对象又是业务的表征,连接既是实体的数据获取工具也是屏蔽复杂性的手段。整体来看,DataFabric是利用AI、机器学习和数据科学等技术手段,访问数据或支持数据动态整合,以发现可用数据之间独特的、与业务相关的关系。业内有一句通俗的解读:现在的数据层的架构设计还主要是“人找数据”,而DataFabric设计核心是“数据找人”,在合适的时间、将合适的数据推送给需要的人。是不是有点豁然开朗的感觉。Gartner认为,数据编织的核心是充当数据和连接的集成层。数据编织利用对现有、可发现(
6、未知)的元数据资产的持续和动态分析,以支持异构、泛在、智能的多云化的基础设施和数据服务全生命周期的持续打造。Gartner给出的数据编织的典型结构,自下而上分为5个层次,分别是:数据源层:数据编织可以连接各种数据源。这些资源包括存在于企业内部的各类数据源,同时也可以接入公共可用的数据资源。同时,除了结构化数据以外,还包括相关的非结构化数据。但是要注意,这提到的是连接和整合,不是采集和提取。数据目录层:与传统人工编目不同,数据编织强调采用新技术(语义分析、知识图谱、主动元数据管理和嵌入式机器学习(M1)等等)自动识别元数据,持续分析关键指标和统计数据的可用元数据,然后构建图谱模型,形成基于元数据
7、的独特和业务相关关系,以易于理解的图谱方式描述元数据。知识图谱层:数据编织必须构建和管理知识图谱。知识图谱的语义层使用AI/M1算法简化数据集成设计,使其更加直观和易于解释,使数字化领导者的分析变得容易。基于知识图谱的数据应用,将合适的数据在合适的时机自动化推送给数据集成专家和数据工程师,让他们能够轻松访问数据并进行数据共享和使用。数据集成层:集成和整合是数据编织的核心,数据编织提供自动编织、动态集成的能力,兼容各种数据集成方式,包括但不限于ET1,流式传输、复制、消息传递和数据虚拟化或数据微服务等。同时,支持通过API支持与内部和外部利益相关者共享数据。数据消费层:数据编织面向所有类型的数据
8、用户,提供数据和服务,包括:数据科学家、数据分析师、数据集成专家、数据工程师等,既能够面向专业的用户的复杂集成需求处理,也可以支持业务人员的自助式数据准备和分析。数据编织本质上是一个统一的架构理念,通过数据源的自动检测和元数据的主动发现,增强数据与业务的关联和实时性;通过数据知识谱图的构建,加强数据价值呈现;通过数据自动编排和动态集成,形成动态可持续的数据服务。除了架构理念之外,还提供了一套新的数据管理框架,使用户能够轻松访问和共享不同的数据资源。Gartner认为,通过实施DataFabric,企业不仅可以减少一半以上人力驱动的数据管理任务、70%的数据管理工作,让数据质量及运营成本降低65
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 领域 趋势 解读 编织