省域空间治理数字化平台——跨部门空间地址数据关联工具建设需求.docx
《省域空间治理数字化平台——跨部门空间地址数据关联工具建设需求.docx》由会员分享,可在线阅读,更多相关《省域空间治理数字化平台——跨部门空间地址数据关联工具建设需求.docx(13页珍藏版)》请在第一文库网上搜索。
1、省域空间治理数字化平台一一跨部门空间地址数据关联工具建设需求一、项目背景随着我省一体化智能化公共数据平台、省域空间治理数字化平台的不断建设和推广,原有的空间地址已经无法满足各部门应用需求。在此背景下,空间地址信息作为最核心的空间数据资源和时空基础设施之一,需要按照全省一盘棋理念,以工具全省通用共享为目标,建设跨部门空间地址数据关联工具,加大空间地址建设统筹力度,不断提升空间地址数据质量,破解空间地址质量不高、更新困难、服务低效等难题,为各部门提供统一的地址服务,推进省域治理能力现代化建设。二、项目内容及要求(-)建设范围省域空间治理数字化平台一一跨部门空间地址数据关联工具的建设覆盖XX省11个
2、地市的市域建设范围,其中空间地址类型包括院落地址、楼栋地址、户室地址、农村地址、重点关注场所。(1)院落地址主要指各城市建成区内的住宅小区、学校、医院、政府单位、工厂、商厦等地址,主要由门牌地址+院落/商厦名称组成。(2)楼栋地址一般出现在院落场景中,由院落地址+楼栋号组成,楼栋号后缀用一般使用“栋”、“号楼”、“幢”、“座”表示。(3)户室地址一般出现在院落楼栋中,由楼栋地址+单元号+户室号组成。单元号后缀一般用“单元”或“号”表示,户室号后缀一般用“室”、“房”表示。(4)农村地址针对的是城中村、自然村、行政村场景,由街路巷和门牌号组成,街路巷记录门牌所在的村组名称(自然村/行政村),门牌
3、号记录门牌编号,包括主号和支号。(5)POI数据针对的是政府部门在日常管理工作中所常用的、重点关注的政府机关、事业单位、医院学校、重点公服设施等。如“XX省自然资源厅”、“XX大学”、“杭州市第一人民医院”等。(二)具体建设内容及要求1、空间地址规范制定在充分遵循相关国家标准、行业标准和地方标准的基础上,结合XX省实际情况,制定空间地址规范体系,定义空间地址结构、空间地址编码、空间地址服务规范、PO1入库及服务规范等内容,规范相关术语、地址模型、地址描述、编码规则、服务方式等内容,为本期项目空间地址库的建立提供标准规范基础。2、空间地址治理与建库针对XX省范围,以民政、自然资源等部门已有地址数
4、据为基础,以乙方社会企业源地址为补充,通过自动化为主、人工为辅的方式开展院落级/楼栋级/户室级多源地址融合建库,包括存量地址评估、地址数据预处理、多源地址增量融合、地址规范性治理、地址空间性治理,做到描述规范、位置准确、名称统一,形成全省空间地址成果库。(1)存量地址评估收集民政、自然资源等部门已有地址数据,从数据类型、地址结构完整性、规范性、准确性等多个维度对地址数据进行综合评估,初步确定地址特征,摸底地址数据质量。1)通过地址类型统计,分析存量地址的详细程度和整体分布情况;2)通过地址结构完整性评估,分析地址在层级结构上存在的缺失、重复、错乱等问题;3)通过地址规范性评估,分析各类全半角、
5、大小写、乱码、多余字符等非标准写法的问题;4)通过地址准确性评估,分析地址存在街道路名错误描述、位置错误、旧地址等问题。(2)地址预处理预处理是空间地址治理中的基础环节,能实现对存量地址的分词、排重、分流、以及无效地址处理等。1)空间地址分词基于深度学习的空间地址大数据智能分词技术,对存量空间地址的文本结构进行自动化解析,基于分词结果提取空间地址中的关键字作为主体信息,作为识别空间地址级别和治理建库的重要依据。2)空间地址压缩排重通过语义分析、相似度分析等,对存量空间地址描述同一地点的空间地址进行排重和唯一性处理,实现空间地址的压缩排重。3)空间地址分流通过空间地址主体信息将空间地址分流成城镇
6、空间地址和农村空间地址,有效提升空间地址治理的效率与质量。4)无效空间地址处理存量空间地址中包含一些无效空间地址或无法正常使用的空间地址,通过识别空间地址状态标识、主体提取等方式将无主体信息的垃圾空间地址标记为无效空间地址。(3)多源地址融合将政府部门已有地址与乙方社会企业地址进行关联碰撞,识别政府部门地址缺失部分,包括聚合排重、关联碰撞、融合运营等,补充完善小区院落级、楼栋级、户室级地址,标签区分地址数据来源。1)多源地址聚合排重基于分词算法、匹配算法、社会企业地址能力,对民政、自然资源等政府部门地址按照AOI/楼栋逐级聚合,剔除重复地址,并形成地址间上下级关系。2)多源地址关联碰撞将自然资
7、源等政府部门地址、社会企业数据与民政地址进行关联,一方面可从关联关系中挖掘语义别名,另一方面可从未完全关联地址中中开展增量识别,识别出疑似缺失的数据,同时标记关联级别、业务地址类型等。3)多源地址融合运营对多源地址融合和关联结果进行人工运营,包括算法迭代运营和人工运营。通过分析融合关联结果优化关联匹配能力,提高自动化关联率。在此基础上对融合关联结果进行人工关联作业和结果核实等工作,保证应融尽融。(4)规范性治理按照空间地址规范对多源地址融合结果进行规范化治理,包括格式规范化、冗余信息剔除、地址元素修复、地址命名归一等,保障地址的标准化、规范化描述。1)格式规范化针对地址中存在各种繁简体、全半角
8、、大小写等格式不规范、特殊符号等问题进行处理。2)冗余信息剔除地址中的描述信息冗余,导致地址元素杂乱,影响地址元素结构,对特殊后缀、邮编、无意义词等后缀进行剔除。3)地址元素修复针对地址信息结构错乱、行政区划/街道/小区等信息错误、缺失等问题,通过地址属性信息校验、地址元素关系挖掘、相似度分析等手段开展错误地址元素修改和缺失地址元素补充等修复工作。4)地址命名归一对地址数据从整体一致性的维度进行修复和归一,解决如同一AOI对应多个街道/门牌号或者楼栋单元后缀不一致等一致性问题。(5)空间性治理以自动化挖掘为主,人工内业核实为辅的方式,开展已有坐标校验、缺失坐标补充,基于社会企业的地址挖掘,为地
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 空间 治理 数字化 平台 部门 地址 数据 关联 工具 建设 需求