面向知识图谱构建的电子战领域语料库建设.docx
《面向知识图谱构建的电子战领域语料库建设.docx》由会员分享,可在线阅读,更多相关《面向知识图谱构建的电子战领域语料库建设.docx(17页珍藏版)》请在第一文库网上搜索。
1、面向知识图谱构建的电子战领域语料库建设目录编者按1语料库简介2引言2?知识图谱基本概念31. 1.知识图谱介绍31.2. 知识图谱重要特点31.3. 知识图谱的作用41.4. 知识图谱在人工智能中的应用4?语料库是什么意思42. 1.分类52. 2.语料库有三点特征5?总体框架5?电子战领域本体构建7?本体构建方法步骤7?电子战领域本体内容8?基于schema的电子战领域语料标注9?标注体系设计10?电子战领域关系schema构建10?标注标签11?两阶段自动标注模型11?命名实体识别模型12?关系模式匹配12?语料库实现及质量分析13?语料库信息统计13?语料库应用效果15?结束语17编者按
2、本文提出了一种基于领域本体的电子战领域语料库构建方法。试验结果表明,该方法可较好完成语料库构建工作,有助于电子战领域的知识体系梳理及语料库建设,可为电子战领域知识图谱构建提供支撑。语料库简介语料库构建是领域知识图谱构建的基础步骤和关键环节,高质量的语料能够提高知识抽取和知识推理等任务的准确率和置信度。目前,电子战领域尚无公开的语料库,这也成为了电子战领域知识图谱构建的难题之一。鉴于此,提出了一种基于领域本体的电子战领域语料库构建方法。试验结果表明,该方法可较好完成语料库构建工作,有助于电子战领域的知识体系梳理及语料库建设,可为电子战领域知识图谱构建提供支撑。引言电子战领域指涉及使用电磁能、定向
3、能和水声能等技术手段,确定、扰乱、削弱、破坏和摧毁敌方电子信息系统与电子设备,确保己方电子信息系统与电子设备的正常使用而采取的各种战术技术措施和行动的专业领域。电子战作为现代战争重要的作战手段,其数据资源规模大且专业性强,而领域知识图谱构建能够充分利用数据资源,为电子战领域情报处理和频谱管控等提供支撑。面向知识图谱构建的电子战领域语料库指内容涉及电子战领域并且可提供知识图谱构建所需基础语料的语料库,包括经过处理的未标注和标注语料。高质量语料库是知识图谱构建与运用的关键和基础,目前通用领域的语料库构建较成熟,学术界和工业界具备的大规模标注数据可支撑知识抽取和知识推理等知识图谱构建技术的研究与应用
4、。但随着专业领域对挖掘数据深层关系的需求不断增强,通用型知识图谱己无法支撑专业领域智能应用,因此构建垂直领域知识图谱成为各专业领域的迫切需求。参考军事领域语料库构建方法,有助于对专业性较强的电子战领域语料库建设进行研究。周彬彬等针对军事语料实体,提出了一套统一的军事词性标记规范和军事语料标注规范,设计了一种基于军语词典的军事语料实体特征提取框架;冯鸾鸾等以维基百科中军事领域的新技术为基点采集语料,制定了一系列军事技术文本的标注规范,并通过人工标注方式构建了面向国防科技领域的技术和术语语料库。以上研究虽然表明利用自动标注方法构建高质量大规模语料库是可行的,但由于不同领域的语料库和语料库构建方法具
5、有其领域特性,使得这些方法难以移植到电子战领域知识图谱构建中,因此需构建电子战领域语料库以进行面向知识图谱构建与研究。针对现有研究并面向知识图谱构建的语料库建设需求,本文提出了一种基于领域本体的电子战领域语料库构建方法(本文方法)O设计了电子战领域知识本体,明确了领域知识的边界和层次结构;设计了基于领域词典的电子战领域源生数据获取方法,将从互联网爬取的电子战领域新闻、百科词条和学术论文等非结构化文档作为条令条例、理论著作和战例想定等现有文本资料的补充;根据领域本体设计标注体系,通过标注少量高质量语料形成种子语料,并通过自动标注算法迭代获取更多的标注语料,实现了电子战领域语料库建设以及语料库统计
6、分析。知识图谱基本概念知识图谱又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。1.1. 知识图谱介绍通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。1.2. 知识图谱重要特点用户搜索次数越多,范围越广,搜索引擎就能获取越多信息和内容。赋予字串新的意义,而不只是单纯的字串。融合
7、了所有的学科,以便于用户搜索时的连贯性。为用户找出更加准确的信息,作出更全面的总结并提供更有深度相关的信息。把与关键词相关的知识体系系统化地展示给用户。用户只需登录Goog1e旗下60多种在线服务中的一种就能获取在其他服务上保留的信息和数据。Goog1e从整个互联网汲取有用的信息让用户能够获得更多相关的公共资源。1.3. 知识图谱的作用在辅助语言理解方面起的作用有:实体消歧:对文中提到的多义词进行精准判断,如上文提到的苹果案例。指代消解:对文中的代词做出解释,如他和它。图谱可以结合各类领域的知识,打造领域型的知识图谱,在大数据分析方面,工业落地主要应用如下:推荐:知识图谱中包含了丰富的关联性,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 面向 知识 图谱 构建 电子战 领域 语料库 建设