电力大数据数据质量评测规范(2022征求意见稿).docx
《电力大数据数据质量评测规范(2022征求意见稿).docx》由会员分享,可在线阅读,更多相关《电力大数据数据质量评测规范(2022征求意见稿).docx(13页珍藏版)》请在第一文库网上搜索。
1、:C。电力大数据数据质量评测规范Eva1uationindicatorsforpowerdataqua1ity团体标准-XX-XX发布XXXX-XX-XX实施目次前言II1范围12术语和定义13指标框架24数据质量评价指标25数据质量评价过程8本标准按照GB/T1.1-2009给出的规则起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。本标准由中电联(SAC/TC28)提出并归口。本标准起草单位:XXXo本标准主要起草人:XXXo电力大数据数据质量评测规范1范围本标准规定了电力大数据质量评价指标的框架及评价过程。本标准适用于电力大数据生存周期各个阶段的数据质量
2、评价。2术语和定义下列术语和定义适用于本文件。2.1数据data信息的可再解释的形式化表示,以适用于通信、解释或处理。注:可以通过人工或自动手段处理数据。GB/T5271.1-2000,定义O1o1O21.1 2元数据metadata关于数据或数据元素的数据(可能包括其数据描述),以及关于数据拥有权、存取路径、访问权和数据易变性的数据。GB/T5271.17-2010,定义17.06.051.2 3数据质量dataquaIity在指定条件下使用时,数据的特性满足明确的和隐含的要求的程度。原始数据rawdata终端用户所存储使用的各种未经过处理或简化的数据。注:原始数据有多种存在形式,如文本数据
3、,图像数据,音频数据或者几种数据混合存在。数据生存周期dataIifecyc1e将原始数据转化为可用于行动的知识的一组过程。数据集dataset具有一定主题,可以标识并可以被计算机化处理的数据集合。数据模型datamode1对分析的图像和文本表述,该分析识别了组织为完成其使命、功能、目标、目的和战略,以及管理和评价组织所需要的数据。注1:在从高到低的不同抽象层次表示数据时,通常会区分概念模型(与某些努力相关的概念组成的模型)、逻辑模型和物理模型。注2:所使用数据模型的使用周境的边界的正规描述,称为上下文模式。注3:数据模型标识实体、域(属性)以及与其他数据的关系(关联),提供数据和数据间关系的
4、概念视图。示例1:由框图组成的语义数据模型,这种框代表对业务有意义的事务集,如“人”或“行动”,以及描述这类实体对之间关系的线条。示例1:应用特定数据管理技术的关系表或可扩展标记语言XM1等是逻辑数据模型。2.8数据标准datastandard数据的命名、定义、结构和取值规范方面的规则和基准。3数据质量评价指标框架数据质量评价指标框架见图1。可访问性数据质量评价指标框架e,匚整性图1数据质量评价指标框架数据质量评价指标框架包括规范性、完整性、准确性、一致性、时效性和可访问性六项,具体的定义如下:a)规范性:数据符合数据模型、业务规则、元数据或权威参考数据的程度。b)完整性:按照数据规则要求,数
5、据元素被赋予数值的程度。C)准确性:数据准确表示其所描述的真实实体(实际对象)真实值的程度。d)一致性:数据与其他特定上下文中使用的数据无矛盾的程度。e)时效性:数据在时间变化中的正确程度。可访问性:数据能被访问的程度。4数据质量评价指标数据质量评价指标共分为二级,一级指标是数据质量评价指标框架中的六项指标,每一项一级指标包含数量不等的二级指标,每一项二级指标包含数量不等的指标子项。数据质量评价二级指标见表1。表1数据质量评价指标级指标二级指标指标描述计算公式计算公式描述规则示例规范性数据模型数据符合数据模型的度量。X=AB*100%A=满足数据模型要求的数据集中元素的个数B=被评价的数据集中
6、元素的个数元数据数据符合元数据定义的度量。X=AB*1OO%A=满足元数据定义的数据集中元素的个数B=被评价的数据集中元素的个数包含各字段名称、描述、类型值域等内容的数据字典为一种元数据文档业务规则数据符合业务规则的度量。X=AB*1OO%A=满足业务规则的数据集中元素的个数B=被评价的数据集中元素的个数权威参考数据数据符合参考数据定义的度量。参考数据是系统、应用软件、数据库、流程、报告及交易记录和主记录用来参考的数值集合或分类表。X=AB*1OO%A=满足参考数据规则的数据集中元素的个数B=被评价的数据集中元素的个数一张用于一个特定字段的有效值列表为一种参考数据类型安全规范数据符合安全规范的
7、度量。安全规范是安全和隐私方面的规则,包括数据权限管理,数据脱敏处理等X=B*1OO%A=满足安全规范的数据集中元素的个数B=被评价的数据集中元素的个数完整性数据记录完整性按照业务规则要求,数据集中应被赋值的数据记录的赋值程度.X=AB*1OO%A=被赋值得数据集中元素的个数B=预期被赋值的数据集中元素的个数对表指定字段非空值检测准确性数据内容正确性数据内容是否是预期数据。X=AB*1OO%A=满足数据正确性要求的数据集中元素的个数B=被评价的数据集中元素的个数订单金额+税额=发票金额数据格式合规性数据格式(包括数据类型、数值范围、数据长度、精度等)是否满足预期要求。X=AB*1OO%A=满足
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 电力 数据 质量 评测 规范 2022 征求意见
