计量检测数据开发流程.docx
《计量检测数据开发流程.docx》由会员分享,可在线阅读,更多相关《计量检测数据开发流程.docx(6页珍藏版)》请在第一文库网上搜索。
1、计量检测数据开发流程第一章总则第一条计量检测过程中会产生大量过程数据与结果数据,通常这些数据被作为原始记录或者证书报告结果被保存。各个检测机构之间的数据孤立,造成计量检测数据难于成规模的被用作数据挖掘使用。第二条本流程将着眼于计量大数据应用的数据来源,重点解决数据采集方式、数据类型、数据脱敏、数据清洗、标准协议等问题,为后期计量数据各类应用建模提供支撑。第三条本流程拟用于计量检测数据相关上层应用开发以及全国检测机构数据上传应用的技术选型及参考。第二章采集数据第四条各检测机构的计量数据库中已经存储了大量的数据,包括结构化的和非结构化的,但是分布在不同的系统,形成了难以维护管理的“蜘蛛网”,需要建
2、立统一的数据管理和访问平台,便于统一维护和管理,提供“一站式”的数据访问服务。第五条所有上层应用接收各检测机构上传的数据必须经过数据中心统一数据接口,各上层应用计算、展示等使用数据也需调用数据中心统一接口,不得使用自建存储私自保存数据。第六条所有接入数据中心的数据需携带数据提供者ID标识、建立上传连接前需经过数据中心的数据提供者统一认证接口认证。第七条国家计量检测数据中心存储的结构化数据。举例如下:强检数据:器具名称,型号规格,测量范围,准确度等级,出厂编号,自编号,生产厂家,生产地,购买日期,安装使用地点,器具状态,器具用途,器具类型,检定方式,检定证书号,有效期。检测机构数据:机构名称、地
3、址、法人代表、联系人、联系电话、实验室面积、所属类别、证书号、批准日期、有效日期、是否备案、名称、建立计量标准数、实验室面积、设备总值。检测机构专业部门:部门名称、专业、检测项目、检测人员、联系方式。检测机构注册计量师:级别、姓名、性别、身份证号、工作单位、注册编号、注册有效期、资格证书编号、合格证明编号、检定员证编号、继续教育学分逾期、继续教育学分重新、专业、项目、子项目、规程/规范名称及编号、联系电话。 年度计量比对能力验证情况:项目名称、组织单位、主导单位、参与单位、比对结果概述、主要问题概述。 建立计量标准:类别、建标单位名称、计量标准名称、计量标准证书号、建标人及建标时间、测量范围、
4、不确定度或准确度等级、依据规程规范、检定或校准项目、批准机关名称、主考核单位、证书批准日期、证书有效日期。第八条非结构化数据及半结构化数据。对于非标准化、非机构化以及半结构化的数据,数据提供者自行设计数据格式,使用BSON类型(是一种类json的一种二进制形式的存储格式)进行传输,数据中心将采用NOSQ1数据库进行存储。非结构化数据举例如下: 检测数据:送检日期、器具名称、委托单位名称、型号规格、检定结论、量程、精度等级、制造厂家、出厂编号、检测日期、检测周期、检测地点、检测温度、相对湿度等元数据,每个机构可自行规定上传的数据。 检测证书:二进制WoRD、PDF、图片。 检测原始记录:XM1、
5、二进制WORD、EXe1E、PDF、图片。 仪器自动化数据:状态、使用次数、自检信息、过程数据等。 时序数据:温湿度数据、压力数据、设备的各类监控传感器数据。第三章数据脱敏处理第九条对于检测机构,部分数据属于客户的隐私信息或行业机密(计量的准确度和设备等级在很大程度上决定了该实体在整个行业的水平,尤其是军工和科研机构),在进行大数据共享时要注意保护。同时各个检测机构对于内部的隐私数据,经内部许可允许上传使用时,也应注意这部分数据的隐秘性。数据提供者(检测机构)对于上传数据,需在上传前统一进行动态的脱敏处理,数据中心保存的数据属于静态脱敏后的数据。第十条数据提供者(检测机构)对于上传的数据按可按
6、隐私级别分为高、中、低三等进行脱敏保护。低等级可不进行脱敏处理,其余可采取下列一种或者几种方法进行数据脱敏,存于数据中心的数据即默认可被合法访问。去除标识信息:从数据中去除能够识别个体的明显标识变量,如个体的姓名、地址等。即使原始隐私数据去除了标识符,其仍有高可能识别其中的个体,被处理过的数据仍然存在个体层面的信息,潜在的标识信息仍然存在于被去除表示信息的数据中。假名替换:用人工标识符或者假名替换数据库中的标识性字段,如用引用性编码或假名替代姓名等标识符。应用编造假名可以在保持数据原始可用性的同时降低数据中个体的可标识性,有利于数据共享。若关联其他仍包含个人标识隐私信息的数据,通过假名替换处理
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 检测 数据 开发 流程