《数据产品登记信息描述规范.docx》由会员分享,可在线阅读,更多相关《数据产品登记信息描述规范.docx(13页珍藏版)》请在第一文库网上搜索。
1、数据产品登记信息描述规范1范围本文件规定了数据产品的代码集、描述属性、登记信息、信息扩展等内容。本文件适用于开展数据产品登记业务的各单位,用于规范数据产品登记的业务过程。其他具有数据产品的单位也可参考使用。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T4754-2017国民经济行业分类GB/T5271.1-2000信息技术词汇第1部分:基本术语GB/T18391.1-2009信息技术元数据注册系统(MDR)第1部分:框架GB/T400
2、94.2-2023电子商务数据交易第2部分:数据描述规范3术语和定义下列术语和定义适用于本文件。3. 1数据data信息的可再解释的形式化表示,以适用于通信、解释或处理。来源:GB/T5271.1-2000,01.01,02数据产品dataproduct有价值的数据,或基于数据提供的有价值的内容或服务。源数据sourcedata本文所指源数据是作为原材料用来生产、提供数据产品的数据。原始取得origina1acquisition源数据的获取方式之一,是指组织在开展自身业务活动的过程中获取源数据。收集取得coIIectionacquisition源数据的获取方式之一,是指从互联网爬取或问卷调查等
3、方式从组织外部获取源数据。3.6交易取得transactionacquisition源数据的获取方式之一,是指通过交易的方式从组织外部获取源数据。3.7即时供应providenow当前就能提供该数据产品。3.8延时供应provideIater在未来的某一时间点才能提供该数据产品。3.9实体entity任何现存、曾经存在的或可能存在的具体的或抽象的事物,包括事物间的关联。示例:一个人,对象(物体)、事件、观念、过程等。注:实体的存在不依赖于是否有关于它的可用数据。出自GB/T18391.1-2009,定义3.2.103.10属性attribute一个对象或实体的特征。出自GB/T18391.1-
4、2009,定义3.1.13.11信息元素informationeIement信息的基本单元。例如:中文名称、描述、数据类型、数据格式、值域等。注:信息元素在信息实体中是唯一的。出自GB/T40094.2-2023,定义3.143. 12信息实体informationentity一组说明数据相同特性的信息元素。例如:登记编号、名称、关键词、所属行业、提供形式等。注:可以包含一个或一个以上信息实体。出自GB/T40094.2-2023,定义3.1.54缩略语下列缩略语适用于本文件。API:应用程序编程接口(App1icationProgrammingInterface)5代码集3.1 数据产品提供
5、形式数据产品提供形式代码集如下表1所示。表1数据产品提供形式代码集代码代码名称说明1数据集2数据报告3数据接口4数据应用9其他产品5.2使用对象限制代码集使用对象限制代码集如下表2所示。表2使用对象限制代码集代码代码名称说明1政府用户2企业用户3个人用户9无限制5.3源数据取得方式代码集源数据取得方式代码集如下表3所示。表3源数据取得方式代码集代码代码名称说明1原始取得2收集取得3交易取得9其他6描述属性本文件中使用五个属性对数据产品的信息元素进行描述,见表4所示。表4信息元素描述属性及说明序号描述属性定义及说明1中文名称信息元素的中文名称。2描述对信息元素含义的解释。3数据类型对信息元素的有
6、效值域的规定。数据类型说明见附录A。4数据格式对允许信息元素该值域内的值进行有效操作的规定。数据格式见附录A。5值域信息元素所允许值的集合7.1 7登记信息7.2 概述7.2.1 数据产品的登记信息按适用范围分为:通用信息:适用于所有数据产品的信息;个性信息:仅适用于某些类别的数据产品。7.2.2 数据产品的登记信息按登记的必要性分为:必选信息:保证能够充分了解该数据产品的必要信息;可选信息:为能更好地了解该数据产品的信息。7.2.3 登记信息的框架如下图1所示。一G蕨一J7. 2登记信息数据产品登记信息表如下表5所示。表5数据产品登记信息表序号中文名称描述数据类型数据格式值域备注1登记编号登
7、记机构为数据产品分配的唯一编号,可用来识别不同的数据产品字符型C17SDDR+8位登记日期+5位登记次序,其中登记日期格式为YYYYDD必选信息2名称数据产品在登记时采用的名称,应突出数据产品的内容、特点等字符型C.50自由文本必选信息,涉及版本更新的,应同时注明版本号3关键词用来描述数据产品信息的关键词语,可有多个字符型C.16自由文本必选信息4所属行业数据产品所属的国民经济行业的行业名称字符型C.u1采用GB/T4754-2017国民经济行业分类的类别名称必选信息5提供形式数据产品的提供形式枚举型E数据集、报告、接口应用、其他必选信息6简介数据产品的简要介绍,便于快速了解产品信息。内容包括
8、但不限于数据内容、用途、规模、覆盖范围等方面字符型C.500自由文本必选信息7适用场景数据产品允许使用的场景,包括条件、范围等字符型C.150自由文本必选信息8禁用场景数据产品禁止使用的场景,包括条件、范围等字符型C.500自由文本必选信息9使用对象数据产品限制为仅供哪些类型的对象使用,可多选枚举型E政府用户、企业用户、个人用户、无限制必选信息10即时供应数据产品提供方自登记之日起,是否已经具备对外提供该数据产品的条件布尔型B是、否必选信息11授权使用数据产品使用时是否需要被查询对象授权布尔型B是、否必选信息12共有数据产品申请登记的数据产品是否与其他单位共有。申请登记的数据产品由多家单位共同
9、合作生产的,可由全体参与单位共同协商确定一名申请人作为代表申请登记,也可由任意一方在不损害其他方利益的前提下独立申请登记。无论代表登记或独立登记,均应当注明其他共有方布尔型B是、否必选信息表5(续)数据产品登记信息表序号中文名称描述数据类型数据格式值域备注13数据来源源数据名称数据产品源数据的名称,如社保数据、微博数据、纳税数据。应按照源数据的内容及来源进行命名字符型C.u1自由文本必选信息取得方式获取该源数据的具体方式枚举型E原始取得、收集取得、交易取得、其他方式必选信息来源渠道该源数据的获取渠道,如本单位、某电信运营商、某互联网公司或某委办局等字符型C.U1自由文本必选信息证明材料用来证明
10、源数据来源渠道的材料,如跟来源渠道的合作协议或来源渠道的授权证明等二进制型无要求文件必选信息更新周期源数据更新的时间间隔,如每天更新一次。一般是以天、周、月等为单位的时间间隔,也可以是实时更新,或不更新字符型C.U1自由文本必选信息14时间跨度申请登记的数据产品中数据采集始末的时间段,如数据集产品中数据采集时间为2018年1月至2019年1月字符型C.U1数据产品供方自定义必选信息15详细信息数据产品的详细描述信息。不同类型的数据产品,其详细信息描述的内容不问数据报告可描述报告的摘要等;数据集可描述数据样例等;数据接口可描述接口功能、接口参数、请求示例等;数据应用可描述使用说明、应用案例等。必
11、要时可上传相关附件字符型C.U1自由文本必选信息16延时供应时间当数据产品不能即时供应时,需要填写在什么时间能够提供,即延时供应时间日期时间型YYYY-MM-DD大于当前时间可选信息17共有数据产品方名称申请登记的数据产品由多家单位共同合作生产时,其他共有方的名称字符型C.U1自由文本可选信息18脱敏方式对数据产品中所包含的敏感信息是如何脱敏的字符型C.U1自由文本可选信息19数据规模用来生产数据产品所使用的源数据的规模,可从字段数量、记录条数、所占存储空间等多个方面来描述字符型C.U1自由文本可选信息20失效时间数据产品不再提供的时间日期时间型YYYY-MM-DD大于当前时间可选信息21相关
12、附件数据产品登记信息的证明材料、补充说明等其他申请材料。如数据报告的报告目录、内容节选截图等;数据集的截图、样例文件等;数据接口的相关指导文档等无要求无要求文件可选信息22数据产品示例数据产品的典型例子,可展示产品的部分具体内容字符型或二进制型无要求无要求可选信息表5(续)数据产品登记信息表序号中文名称描述数据类型数据格式值域备注23数据集文件格式数据集存储文件的格式,如Exce1女件、xm1文件、csv文件或json文件等字符型C.u1自由文本个性信息,示例见附字段信息数据集的字段信息,包括字段名称字段类型、字段说明等字符型C.U1自由文本不B24数据报告报告更新周期数据报告更新的时间间隔,
13、一般是以天、周、月等为单位的时间间隔,也可以是不更新字符型C.u1自由文本个性信息,示例见附录B报告形成日期数据报告形成的时间,如某一天、每月的某一天、每周几等,或根据数据产品需方定制时间周期字符型C.u1自由文本25数据接口接口地址数据接口的接口地址,应为完整的请求地址,如api字符型C.u1自由文本个性信息,示例见附录B请求参数调用数据接口时应填写的参数,包括参数名称、类型、参数说明等字符型C.u1自由文本返回参数调用数据接口后,返回值中具有的内容,包括参数名称、类型、参数说明等字符型C.U1自由文本返回类型数据接口的返回值的表示形式,如JSON、XM1等字符型C.u1自由文本请求方式数据接口的请求方式,如GET、POST等字符型C.u1自由文本26数据应用应用版本号数据应用类产品的版本号字符型C.u1自由文本个性信息,示例见附录B试用链接数据应用的试用网址或下载可试用的数据应用的链接字符型C.U1自由文本8信息扩展本文件中的信息实体和信息元素可根据不同用户的实际需要和新出现的数据类型进行扩展,扩