自标准数据设想与QA20140122.docx
《自标准数据设想与QA20140122.docx》由会员分享,可在线阅读,更多相关《自标准数据设想与QA20140122.docx(14页珍藏版)》请在第一文库网上搜索。
1、2013自标准数据设想2013-11-2概述自标准数据,Se1f-StandardedData,即自带标准或格式的数据体。数据提供者按照自己的标准或格式提供数据,并将该数据所使用的标准或格式与所提供的数据一起打包,数据使用者按照该标准或格式自行解读并使用数据。它是传统数据标准体系的重要补充和突破。这一设想的初步想法本人于2013年10月形成。目的是为了解决“数据标准过严不易推行,过松不易整合”的问题。顺应“数据使用者急,积极性高;而提供者不急,积极性不高”的实际情况,按照客观规律充分调动数据使用者的主动性,减轻数据提供者的负担。理念一经提出即受到多位专家、学者支持,在智能数字油田开放论坛热烈讨
2、论,在大庆油H1也引起一部分人的关注,并计划在即将实施的系统中进行试验。下图是本人设计的自标准数据的标识图。自标准数据Se1f-StandardData定义自标准数据,Se1f-StandardData,即自带标准或格式的数据体。数据提供者按照自己的标准或格式提供数据,并将该数据所使用的标准或格式与所提供的数据一起打包,数据使用者按照该标准或格式自行解读并使用数据。它是传统数据标准体系的重要补充和突破。性质自标准数据打破了大家共同遵守统一标准的局限,给数据共享提供了更加切实可行的路径。其具有如下性质:(I)自标准数据是一种数据体,它既包含数据本身还包括数据格式;(2)自标准数据是元数据的一种特
3、例,元数据与数据捆绑;(3)自标准数据是一种全新的数据共享模式,打破了传统的数据与标准脱离的局面;(4)自标准数据是一种客观、现实的数据管理策略,适应性强;(5)自标准数据是大数据的基本单元,采用自标准数据技术有利于大数据技术发展;(6)自标准数据是系统自治思想的应用。与传统数据库等的区别自标准数据离不开传统数据库及相关技术的支持,但仍有很多明显区别:(I)传统数据库里面的数据注重存储、查询、更新,二自标准数据更注重流动性,主要目的是数据共享;(2)传统数据库的元数据与数据分离,查询数据时在数据库系统上分析元数据,而自标准数据中的标准就相当于元数据,它不固定在数据库上,而是随着数据体一起流动;
4、(3)传统数据库存储的数据量是积累性的,会越来越大,而自标准数据是增量性的,每次的体量可能变化不大,体量一般不大;(4)传统数据库的数据结构与数据本身加起来也可以看做是一种自标准数据体,只是体积大,不便于流动;反过来,自标准数据体可以看作是流动的数据库,只是体量较小;(5)传统数据库重视冗余,自标准数据不重视冗余,而重视时效性;(6)传统数据库结构是严格统一的,而自标准数据的格式和标准是允许自定义的;(7)传统数据库主要支持某个(些)专门软件,而自标准数据主要支持系统间数据共享;(8)与其他具体的大数据理论或技术相比,自标准数据主要是一种思想,可使用多种方式和技术实现。起源1998年,大庆油田
5、开展了一个项目勘探、开发、钻井数据一体化共享。该项目目标是建立一个油田内部数据共享的平台。当时认识到,“数据使用者急,积极性高;而提供者不急,积极性不高J鉴于此,为了实现项目目标,项目组决定顺势而为。本人是项目负责人,当时我提出一个想法,叫做“数据码头”,就是数据提供者把数据放在指定位置就不管了,使用者自己去取,去处理。使用者再产生的数据也放到码头上。这样就调动了使用者的主动性,也减轻了提供者的工作量。该想法得到了项目组的认可。但后来大庆油田重组,勘探和钻井的大部分业务与油田开发分离,此项目下马。那时还是要求提供者按统一标准把数据放到“码头”上,提供者还要处理数据,所以没有把提供者的工作量减到
6、最小。当时,还没有XM1,也没元数据,也没想到用它来描述数据。2013年,大庆油田制定信息规划过程中,关于信息共享(十多年过去了,问题依然很多)进行了讨论。期间本人对“数据码头”思路进行了进一步的扩展,应用XM1,让提供者按照自己的格式提供数据,还要包含这些数据的格式。这样,这些数据就成为了“自标准数据。使用者能读明白,想怎么用就怎么用。大家都方便。2013年10月,本人为长安大学数字油H1论坛第三届大会准备题为数据多了就智能!的演讲材料时,与数字油田研究所所长高志亮教授、高倩博士进行了较深入的探讨,形成了较完整的思路。本届论坛上,各位专家学者对“自标准数据”给予了充分肯定。参加会议的多位专家
7、学者建议,简化传统数据标准,简政放权,大力推广“自标准数据”,并认为“自标准数据”将成为大数据时代的有力的信息共享的支撑性技术。相关技术配合自标准数据,本人进一步丰富了原来数据码头等概念,并进一步提出了数据泵的概念。数据码头,DataDoCk,即数据提供者放数据的场所。数据提供者把数据放在指定位置就不管了,使用者自己去取,去处理。使用者再产生的数据也放到码头上。数据码头类似百度,只是数据码头提供的数据是给系统用的,而不是给人用。数据码头的核心部件: 统一资源管理器,管理码头、数据资源、标准资源、服务资源; 搜索引擎,类似百度,检索资源; 自标准数据生成器; 码头警察,管理权限、数据更新,清理垃
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 标准 数据 设想 QA20140122
