TGDMA62018科技大数据平台数据仓库建设规程.docx
《TGDMA62018科技大数据平台数据仓库建设规程.docx》由会员分享,可在线阅读,更多相关《TGDMA62018科技大数据平台数据仓库建设规程.docx(11页珍藏版)》请在第一文库网上搜索。
1、ICS00.000.00000GDMA团体标准T/GDMA62018科技大数据平台数据仓库建设规程Datawarehousedatastandards(征求意见稿)XXXX-XX-XX实施XXXX-XX-XX发布广东省市场协会目次前言1范围12规范性引用文件13建模常用词和缩略语13.1 建模常用词及说明13.2 缩略语24建模方法24.1 数据模型24.2 建模工具软件35主题数据说明35.1人员主题35.2单位主题35.3 科技项目主题55.4 科技业务主题55.5 资质认定主题65.6 科技奖励主题7本标准按照GB/T1.1-2009标准化工作导则第1部分:标准的结构和编写给出的规则起草
2、。本标准由广东精点数据科技股份有限公司提出并归口。本标准起草单位:广东省科技厅、广东工业大学、广东精点数据科技股份有限公司。本标准主要起草人:。本标准为首次发布。科技大数据平台数据仓库建设规程1范围本标准规定了科技大数据平台数据仓库建设的建模常用语和缩略语、建模方法和主题数据说明。本规范适用于广东省科技厅大数据平台项目数据仓库建设(包含数据仓库的前期建设过程及后期的维护、扩展)。2规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB18030-2005信息技术中文编码字符集
3、GB/T20273-2006信息安全技术数据库管理系统安全技术要求GB/T12991.1-2008信息技术数据库语言SQ1第1部分:框架3建模常用词和缩略语3.1建模常用词及说明见表1。表1建模名词和说明表名词说明源数据提供方是给数据中心提供数据的业务系统,目前包括阳光政务平台等源系统同“源数据提供方”数据接收方指数据仓库接口文件指源数据提供方根据规范要求生成供数据仓库采集的数据,包括接口数据文件、接口校验文件和业务指标校验文件接口数据文件是指源数据提供方根据本规范要求,在指定的时间内,完成对源数据的周期性抽取形成的数据文件接口校验文件指由源数据提供方在每一个抽取周期中,针对每个接口单元的接口
4、数据文件生成的文件级校验依据信息文件级校验报告指数据仓库对接口数据文件做文件级校验后,形成的校验结果文件每日增量指抽取每日00:0024:00发生变化的、新产生的数据最新状态的快照初始全量指抽取第一次源系统所有数据的最新状态快照每月全量指抽取每月月末最后一日24:00时,所有数据的最新状态快照日数据传送截至时刻指源系统完成每日数据传送的最晚截至时刻,定为每日02:00月数据传送截至时刻指源系统完成每月数据传送的最晚截至时刻,定为每月1E104:00日志文件指接口系统在操作过程中数据处理结果的记录文件。由源端接口系统和目的端接口系统产生。包括源端产生的日志和目的端产生的包括传输日志、链路状态日志
5、、告警日志和备份日志等等。3.2缩略语见表2。表2缩略语中文符号与缩略语完整英文高企ic/companyInnovationCompany项目ProjProject技术合同tc/tech_contractTechnica1Contract科技奖励taawardTechno1ogyAward创新券iv/innovvchrInnovationVouchers单位orgOrganation科技项目techprojTechno1ogyProject完成achvAchieve创新innovInnovation技术techTechnica1ZTechno1ogy省份的rvnProvincia1详细dt1D
6、etia1广东省科技厅gdpdstGuangdongProvincia1DdepartmentofScienceandTechno1ogy政府govGovernment信息infoInformation机构instInstitution4建模方法4.1 数据模型科技大数据平台底层细节数据的存储应采用关系数据模型,HIVE数据库,见图1。图1科技大数据平台数据仓库数据存储结构4.1.1 第三范式数据仓库逻辑数据模型宜遵照第三范式进行设计。4.1.2 实体-关系模型数据仓库逻辑数据模型应为采用IDEF1X符号体系的实体-关系模型。4.2 建模工具软件数据中心系统建模工作应采用SDpTeChnOIe
7、)gies公司的PowerDeSigner(V16.5)。5主题数据说明5.1人员主题5.1.1实体说明见表3o表3人员主题实体说明表主要实体实体主要属性实体说明院士信息表姓名、性别、出生日期、年龄、籍贯、毕业院校、工作单位、学历、职称、是否院士、当选年度、研究方向、省科学技术奖获奖情况、科研成果、个人荣誉、主要工作经历、主要贡献基本信息5.1.2参照表实体见表4。表4人员主题参照表实体参照表主要属性地市信息表所属区域、地市编号、地市名称学历类型表学历编号、学历层次职称类型表职称编号、职称层次4.3 单位主题5.2.1实体说明见表5o表5单位主题实体说明表主要实体实体主要属性实体说明高企基本信
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- TGDMA62018 科技 数据 平台 数据仓库 建设 规程