《XX区卫生健康局数据中心治理系统建设需求说明.docx》由会员分享,可在线阅读,更多相关《XX区卫生健康局数据中心治理系统建设需求说明.docx(61页珍藏版)》请在第一文库网上搜索。
1、XX区卫生健康局数据中心治理系统建设需求说明1 .项目背景根据XX省卫生健康数字化改革指南要求,进一步加强健康大脑和健康云建设,完善全民健康信息平台,加强数据质控系统和数据中心安全系统建设。本期项目是在一期、二期基础上夯实数据、深化应用,通过数据质控系统建设加强区域全民健康信息平台的数据治理,提高数据质量,高效支撑数据资源开发利用。数据中心安全系统则是从数据安全出发,贯穿数据中心体系结构中的每个层次,确保数据合法、合理、安全的使用。2 .建设需求建设数据质控系统对区域数据中心的数据质量加强治理,通过基于行业标准和业务属性,全面覆盖的质控标准和质控方案,及时发现数据的质量问题和问题归属责任人,通
2、过质量问题的闭环管理,跟踪数据质量问题的发现、定位、修正、验证的过程,评估数据治理在数据质量提升上的成效和进展。数据中心汇集了大量的数据,其中不少是敏感数据,因此安全问题至关重要。安全保密要从管理、技术等各方面,通过严格的身份验证和权限控制,确保每个人都只能看到与其职能有关并获得授权的数据,而看不到其他与之无关的数据,从而确保数据合法、合理、安全的使用。建设XX区智慧健康保障体系统一门户,接入平台各类业务应用系统,实现统一用户管理、身份认证以及单点登录,解决XX区卫健局内部有多套应用系统,工作人员登录时需要使用多套账户密码从不同应用入口登录,不仅复杂、易出错,还会有密码泄露等问题。因此,计划建
3、设XX区智慧健康保障体系统一门户,接入平台各类业务应用系统,既满足业务人员工作需要,又满足测评需要。3 .建设内容本期项目建设内容详见下表:序号分类系统名称建设内容数量1数据中心治理系统数据质控系统系统主页1套质量评估质量稽查质量跟踪公共资源系统管理2数据中心安全系统数据脱敏服务1套存储加解密服务数据显示页面水印传输加解密服务文件管控用户登录行为分析加密视图分析3统一门户统一授权1套单点登录系统接口4 .功能要求根据XX省卫生健康数字化改革指南要求,进一步加强健康大脑和健康云建设,完善全民健康信息平台,加强数据质控系统和数据中心安全系统建设。4.1. 数据质控系统4.1.1. 整体要求随着区域
4、卫生信息化的快速发展,各类基于健康医疗数据的惠民、惠政、惠医应用被广泛推广,但由于来源于分散医疗机构的业务数据缺乏有效数据质量保障,普遍存在数据质量低、数据关联性差等问题,导致各类应用难以发挥良好的业务价值,这给卫生管理机构及相关平台、应用承建厂商造成困扰,卫生管理机构亟需建立系统、全面的数据质量保障机制,从根本上解决数据质量问题。建设数据质控系统对区域数据中心的数据质量加强治理,通过基于行业标准和业务属性,全面覆盖的质控标准和质控方案,及时发现数据的质量问题和问题归属责任人,通过质量问题的闭环管理,跟踪数据质量问题的发现、定位、修正、验证的全过程。具体需包含:质量稽查、质量分析、问题处理以及
5、系统管理等模块。其中: 质量稽查模块需内置校验规则模型,需支持配置校验数据模型,支持设置校验执行时间和周期等。通过校验发现的问题系统需要提供记录并提供统计分析。 质量分析模块需展示数据质量评估校验结果,支持展示量化分值、指定时间周期质量趋势,详细的校验报告等。 问题处理模块需要主要提供工单管理能力,校验发现的问题需支持形成工单,并指派到具体负责人员,关联具体问题,跟踪后续处理结果。 系统管理模块需要支持配置数据源、数据字典、模型、系统用户和权限、集群运维资源等。4.1.2. 功能要求4.1.2.1. .系统主页需支持通过7个部分内容展示相关数据质量评分、分项、评分趋势、排名等内容。包括:1、综
6、合评分:需支持显示最新数据期所有稽查方案的综合评分。2、分项评分:需支持显示最新数据期所有稽查方案各个分项评分的雷达图。3、综合评分分布:需支持显示最新数据期各个数据级次评分分布情况。4、最近7期综合评分变化趋势:需支持通过折线图展示近7期综合评分变化趋势。5、评分排名TOP5:需支持由高到低显示综合评分前五名的数据级次评分。6、评分变化TOP5:需分上升、下降两种形式展示,上升部分显示上升变化从高到低前5名数据级次评分及上升变化分数;下降部分显示下降变化从高到低前5名数据级次评分及下降变化分数。7、稽查方案评分列表:需支持按稽查方案维度显示各个稽查方案综合评分。4.122.质量评估本功能需提
7、供对数据质量校验结果的分析和展示。需支持通过不同纬度,不同机构等多种纬度,从多个角度对数据质量进行展现。需提供柱状图、曲线图等多种展示形式。同时系统需支持根据系统内部的逻辑算法,对具体的数据进行评分处理。以便可以更直观的了解到数据的质量情况和质量变化情况。包含:质量分析和质量评分两大功能。质量分析数据质量分析功能,需包括数据质量校验报告、各类规则问题统计、数据期同环比分析、问题数据统计、规则类型问题统计等功能。1)数据质量校验报告需提供相关的查询过滤条件,用户可以选择不同的数据期、数据级次和稽查方案等条件。然后通过表格的方式,展示不同数据模型的数据质量情况。需支持的查询条件:包括数据期范围、数
8、据级次、稽查方案和数据模型。其中数据期范围、数据级次、稽查方案为必选项。查询结果中需以数据模型维度分别显示各个模型相应属性正确率、错误率数据。需支持基于查询条件导出相应的数据质量校验报告。在查询出数据质量结果后,支持通过点击“问题数据”,展示所选数据模型的错误数据内容。查询条件中,需提供模型属性、规则类型及数据关键字做进一步查询。点击“错误信息”,需显示此记录具体错误信息。2)各类规则问题统计从校验规则的角度出发,系统需展示不同数据模型下各规则的数据校验情况。需支持通过选择查询条件中的数据期范围、数据级次、数据模型和稽查方案。需支持通过以校验规则的维度进行展示,相应的数据质量情况。3)数据期同
9、环比分析需支持根据查询条件展示不同数据期校验数据问题数和问题率的同比和环比情况,需支持提供数据级次和稽查方案种不同维度查询分析。4)问题数据统计需支持用户通过问题数据统计功能查看错误数据的统计内容,需支持通过稽查方案、模型名称、数据级次、数据期范围等查询条件,查询所查范围内的数据统计汇总和统计明细。5)规则类型问题统计需支持用户通过规则类型维度显示各数据模型的规则类型统计信息。支持通过指定稽查方案、模型名称、数据级次、数据期范围等查询条件,将显示所查范围内的各数据模型校验规则类型统计数据。2、质量评分1)质量综合评分需支持选择不同的数据期和数据级次条件查询,能够展示综合评分、分项评分、稽查方案
10、评分、综合评分变化趋势、分项评分变化趋势和数据级次评分情况等内容。2)质量评分明细需包括:数据级次方案评分、数据级次分项评分和数据模型分项评分三个部分。数据级次方案评分需支持通过数据级次方案评分提供的查询功能,需支持总体查看不同数据级次在不同稽查方案中的综合得分情况。数据级次分项评分需支持通过数据期数、数据级次和稽查方案3个条件进行选择,查看每个数据级次各个分项的得分情况。各个分项评分详情页面需展示包括:属性、规则、规则描述、检查数、问题数等。需提供“导出报告”功能,支持将问题统计信息导出到指定目录中。数据模型分析评分需支持以数据模型作维度,显现各个模型对应的分项评分情况。支持按模型列表显示查
11、询结果,能够按分项评分标准启用项显示此模型对应的分项评分。各个分项评分详情页面需展示包括:属性、规则、规则描述、检查数、问题数等。提供“导出报告”功能,支持将问题统计信息导出到指定目录中。4.1.23质量稽查质量稽查是数据质量控制系统的核心模块。需支持针对具体的业务,将业务转换为系统识别的数据模型、校验规则等系统属性。然后在系统中执行业务数据的校验方案,最后进行校验结果的查看。具体包括:1、数据模型数据模型需支持展示本系统中所使用的各种业务抽象描述信息。需要支持将业务上的数据描述信息抽象成系统理解的数据定义。以便为各种稽查方窠建立规则和进行数据绑定服务。需支持数据模型查看及修改功能。2、数据期
12、通过本功能需支持查看当前系统中存在的所有数据期信息,同时也可以通过对数据期进行重新物化操作来修改当前数据期的具体内容。3、数据级次数据级次需支持在所有的业务稽查方案中共享使用,支持通过系统中的“字典项功能进行定义。在数据级次管理中进行字典项内并以树形机构展示在页面上。4、数据绑定数据绑定功能需支持完成数据源与模型的对应关系的映射,映射之后按照后续标准进行数据质量校验。5、校验规则系统内置的校验规则类型需包括:1)空值检查:检查关键属性是否是空,如果为空则错误,否则成功。2)值域检查规则:检查属性的值是否在值域范围内,范围外则错误,否则成功。3)逻辑检查规则:查属性间是否满足一定的逻辑关系,通过
13、编写规则脚本实现。逻辑检查规则包括简单逻辑检查、复杂逻辑检查和自定义逻辑检查。简单逻辑检查:支持字符串、数值型属性检查。会提供基础表达式定义。复杂逻辑检查:引用已定义的逻辑校验函数,进行数据属性检查。自定义逻辑检查:根据具体业务属性自定义函数进行数据属性检查。4)完整性检查规则:将模型实例作为整体考察是否完整,而不是看实例的某个属性。5)及时性检查规则:检查模型数据的及时性,通过指定模型的时间属性和参照依据来判断。6)规范性检查规则:检查属性值是否满足一定规范,如:身份证号、邮箱和自定义正则表达式。7)一致性检查:检查模型和比照模型可以关联上,但检查属性与比照属性的内容不一致情况。8)记录缺失
14、检查:比照模型的比照属性在检查模型的检查属性是否存在的检查。9)引用完整性检查:检查模型的检查属性在比照模型的比照属性是否存在。10)重复数据检查:根据重复依据检查模型事实数据是否有重复。6、执行方案需支持通过执行方案定义校验执行的频率周期,需支持丰富的设置规则。频率定义包括:分钟、小时、每月几日、月份、每周星期几、指定间隔等。7、质量评分标准质量评分标准需支持定义分项评分和综合评分的标准及业务范围。分项评分标准需支持9个分项,具体包括:完整性、一致性、唯一性、关联性、及时性、准确性、规范性、连续性和全面性。需支持从九个维度评估、展现数据质量评分。每个分项可以对应多个校验规则类型,并可以设置是
15、否启用。综合评分标准需支持包括通用权重设置、稽查方案权重设置和数据级次权重设置。其中通用权重设置需支持设置各维度的权重,通过权重来反应某个维度对综合得分的影响。稽查方案权重设置则是针对某个特定的稽查方案进行个性化设置,其优先级高于通用权重设置。数据级次权重设置则是针对某个特定的数据级次进行个性化自定义权重设置,数据级次权重设置优先级高于稽查方窠权重设置。业务范围设置需支持基于数据级次及数据模型包路径选择相应的模型进行启用、停用的配置。满足用户针对不同数据级次对模型应用的范围进行设定。稽查方案中数据模型与业务范围设置的模型均为启用时会生成有效评分。8、预警策略配置预警策略配置需支持通过定义预警依据、预警对象、预警方式等信息。当执行方案校验结果满足预警依据条件时,会将告警信息按预警方式发送给预警对象。4.12.4质量跟踪数据质量跟踪功能主要通过工单管理的派发、跟踪、管理来实现闭环。1、用户工单登录系统后需展示:1)指定给当前用户的工单,及其他人登记报告,需要登陆者解决处理的工单。2)已确认的工单(数据质量问题提报之后要经过核对确认问题属实,这里展示核对后的工单)。3)当前用户报告的工单(由登陆者发现和等级的数据质量问题工单