知识图谱技术体系总览.docx
《知识图谱技术体系总览.docx》由会员分享,可在线阅读,更多相关《知识图谱技术体系总览.docx(10页珍藏版)》请在第一文库网上搜索。
1、知识图谱技术体系总览本文主题为知识图谱技术体系,主要内容包括:1 .知识图谱体系架构2 .知识图谱构建技术3 .知识存储4 .知识图谱应用技术一、知识图谱体系架构首先来介绍一下整个知识图谱的体系架构。DataFu达观取据知识图谱技术是知侬产、新存幽口知识应用等众多技术的总和,其内容几乎与所有人工智能细分领域都有交叉,是综合性强的领域,也被认为是当前认知智能核心研究内容.合映射式)构技术户处通取式构建技巧构建技术模式设计与管理TSm化与交4式分出H推葬累蟋H可知识源源1助决饿用户接口与界面PW知识图谱是现在非常热门的一个技术,也被认为是认知智能的核心内容。知识图谱包含哪些内容呢?从知识的层面来看
2、,知识图谱包括知识的生产,知识表示存储和知识应用等众多技术。如上图所示,它包括了构建技术,存储技术,应用技术,以及其他相关的很多方面的技术。从这张图中也可以看出,知识图谱包含了人工智能领域绝大多数细分领域的研究,还包括大量的大数据方面的技术,比如构建技术方面也有大数据相关的映射式构建技术,以及基于抽取式构建方面的自然语言处理和计算机视觉和声音处理技术等。在知识图谱的存储方面,现在产业界中主流的是图数据库。图数据库涉及到大量的大数据技术,比如分布式的图数据库会与Hadoop.Spark等分布式计算和分布式存储有很强的技术关联。而一些比较新的技术,比如向量数据库也是比较前沿的一个研究领域。在知识图
3、谱的应用方面,也包括了比较多的内容,比如知识检索、知识探索,涉及到图数据库查询语言Grem1in和Cypher以及SparQ1o知识搜索方面会用一些其他方法从图数据库或者其他存储方法里面获取所需要的知识。在更多的应用里面,比如知识计算,知识推理等。知识计算更多的是与图相关的计算,知识推理更多的是跟深度学习有关的,比如图神经网络。还有很多面向具体的应用,比如问答、推荐、数据分析、知识溯源以及辅助决策等,这些都是与具体业务有直接关联的人工智能或知识图谱方面的应用。二、知识图谱构建技术1 .知识图谱模式知识图谱在应用里面有两个方法:无模式的和模式受限的。我们通常产业应用的知识图谱都是模式受限的。这个
4、模式就是指知识图谱模式,也称本体、类图谱或概念图谱等。DataFut达观取据知识图谱模式OATAGRANOP33概念图谱(ConceptGraph),是面向知识图港内容的一啾躁的、语义化的且概念化魄昭演识图谱阻冲,实体姬以语义化的方式对实体蜘分类,关系蝇则以语义化的方式对关系三5诩进行分类.实体姆的属性名列莉0关系理的属性名歹蛾则是对实体理和关系类型的多维特征的表示.在语义网中,知识图谱模式往往也萌为本体(Onto1ogy),表示知识的m.(Know1edgeGraphSchema),(Schema),(C1assGraph)或知识图谱模式定义了知识图谱需要包含哪些内容,或者说是对知识概念化的
5、一种规范表达。如何设计好一个知识图谱模式是产业里面最先要去考虑的问题,因为它往往与我们的业务相结合,需要知识图谱的专家和面向具体业务的专家一起合作来梳理设计。需要一些方法告诉业务专家如何理解知识图谱模式,怎么去设计模式。这套方法论包括六韬瀑布模型,六韬螺旋模型。一家企业要用知识图谱来解决问题,首先就要理解需要一个什么样的知识图谱,也就是理解业务,设计出合适的知识图谱模式,并在知识图谱模式的指导下设计存储方案、构建图谱、开发基于知识图谱的应用等。2 .实体抽取在设计好知识图谱模型之后,存在的一个问题就是如何从已有的数据中构建出知识图谱。主要涉及两个方面的内容:第一个方面,如果我们的数据是结构化的
6、,可以写一些规则加上一些简单的映射就可以构建出知识图谱,这种方式往往称为映射式构建,另一方面是大量的文档,比如Word文档、PDF文件等各种各样半结构化内容,我们需要对其进行实体抽取和关系抽取,以及指代消解等各个方面的知识抽取C其中最基础的就是实体抽取,在自然语言处理里面也叫命名实体识别。这里面的很多技术从上世纪八十年代到现在已经有四五十年的历史了,有各种不同的方法,比较简单的是写规则,比较成熟的是机器学习的方法,比如CRF条件随机场,隐马尔可夫模型,以及深度学习,现在的基于BERT的预训练模型、以及弱监督学习和基于深度强化学习的实体抽取方法等等。3 .关系抽取知识图谱最大的特点就是关系。在实
7、体抽取之后,就要进行关系抽取。这也是知识图谱区别于标签或者其它结构化数据的很重要的一点。关系抽取也是知识图谱构建非常难的一个环节,这里面有很多不同的方法,比如基于规则的方法,基于深度学习的方法,以及弱监督学习方法都可以用来做关系抽取。当然也有在深度学习兴起以后,非常流行的一个方法:实体-关系联合抽取方法,是在一个模型中同时实现对实体和关系的抽取。具体应用中可以根据需要去选择合适的方法来做关系抽取。4 .事件抽取另外一块就是事件抽取,事件抽取更加复杂,方法与实体关系抽取比较类似。事件抽取(EventExtraction)是指从文本领取出有关特定事件的信息,包括主体、客本中出现的实体和系进行分析,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 知识 图谱 技术 体系 总览