赞
踩

知识图谱是以图的形式表示真实世界的实体与关系之间关系的知识库。
具体来说知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论、方法、与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示其核心结构、发展历史、前沿领域以及整体知识构架,达到多学科融合目的的现代理论。
知识图谱本质是一种大规模的语义网络,以图的知识表达方式形式直观表现客观世界中的实体以及其之间的关系的网络化结构。比起传统的语义网络,它不仅规模巨大,而且语义丰富、质量优异、结构友好,可以支持组织网络数据,从而提供智能搜索服务的知识库。
推理在科技进步和社会发展中一直扮演重要的角色,包含思考-认知-理解-创新到再思考-认知-理解-创新,一直是一个循环状态,也是感知世界的重要途。
面向知识图谱的推理主要围绕关系的推理展开,利用图谱中已有的事实或者关系推断出未知的事实或关系,主要考察实体、关系与图谱结构的特征信息。
随着数据的增长,传统知识推理方法逐渐无法推理出正确率高的事实三元组。随着人工智能技术的发展,深度学习在大数据和计算能力的支持下焕发了惊人的能量,它的分布式表示和深层结构为知识推理提供了强大的建模功能,具有强大的学习能力,而基于深度学习的知识推理使深度学习和知识推理相互促进,以更大的学习额能力进行推理。
G=(V,E)。
知识图谱的架构由数据层和模式层两部分构成。

数据层:数据以三元组的形式存储
模式层在数据层之上,是知识图谱的核心,存储的是经过提炼的知识。模式层是数据层的概念模型或逻辑模型,对数据层规范和约束;模式层更适用于知识图谱推理。
知识图谱的研究源于2000年XML大会上Tim Berners Lee提出的语义Web的理念,最初的作用是为Web网页添加语义信息。
2005年,美国Metaweb公司成立,致力于开发共享的世界知识库。Metaweb基于维基百科等公开的数据集,提取出现实世界中人或事物(实体)以及它们之间的关系,并且以图的结构存储在计算机中。
2010年,谷歌收购了Metaweb公司,并在2012年提出了知识图谱的概念。
DBpedia、Freebase、NELL、Probase。
按照构建方式不同:手工构建(WordNet、HowNet。规模小,能够确保准确性与完整性,质量高但耗时长)和自动构建(NELL、WikiData。自动抽取实体与关系,规模大,存在大量不完整的关系、噪声信息等,常用在知识图谱补全、查询等研究中)。
大批知识图谱被广泛应用于知识图谱补全与去噪的学术研究领域。知识图谱在问题系统、推荐系统、机器翻译等领域发挥重要作用,并已在医学诊断、金融安全、军用等领域展示出很好的应用前景。

常用基于传统规则表示的推理、基于分布式的推理、基于神经网络的推理等
单跳推理:
NELL知识图谱内部采用的是简单的一阶关系学习算法进行推理[1-11]。
ProPPP是一阶概率语言模型,该模型生成了有向证明图,节点对应查询的子句,边对应规则,推理过程为一个查询子句通过规则到另一个查询子句[1-12]。
Tensor Log方法是基于可微的过程,给每一个关系定义一个{0,1}的操作矩阵,关联一个单样本向量,(i,j)表示第i个实体与第j个实体之间是否存在关系,如果存在为1,否则为0[1-13]。该方法可以将逻辑规则的推理形式转化为操作矩阵相乘。
SDType和SDValidate,利用图中的属性和实体类型补全三元组和识别错误的三元组[1-14]。SDType实现了一种类似加权的投票机制,为每一个属性赋予权重。SDValidate首先计算关系-尾实体的频率,然后计算低频三元组的得分,但得分小于设定阈值的时候被判定为潜在错误的三元组。
基于不同的模式评估知识图谱的三元组的质量[1-15]。
基于规则的单条推理方法 可计算性低、代价高、方法简单、使用的知识图谱较少、速度较慢
多跳推理规则更加复杂,如随机行走规则、传递性规则等。以使用规则区域的大小为标准,可以将其分为基于全局的规则和基于局部的规则推理两种。
(1)基于全局的推理
以上基于全局的图结构在整个知识图谱上进行推理,*成本较高,而知识推理一般是在局部图结构上进行;另一方面,全局的细粒度太粗,局部信息的细粒度能够提高推理的准确性。
(2)基于局部的推理
多样本知识图谱基于规则的推理存在效率低下、噪声信息大、规则较少等缺点,并且当前的规则较少,人工挖掘更多复杂规则的代价也很高,可解释性难以保证。但是通过关联局部的结构信息弥补单纯规则的推理值得进一步的研究。
这一块首先要通过模型得到低维向量表示,然后用向量操作来进行对应只是图片的推理。
(1)单跳推理
上述方法准确率高,计算速度相对较快,但都不能处理动态变化的知识图谱。
基于张量分解的方法具有可解释性强、实验的准确性高等优点,但是时间复杂度较其他方法高,所以推广使用的代价较高。
基于空间表示的方法在空间上模拟三元组结构的分布,推理能力较强,但对该方法的研究不多。
(2)多跳推理
(1)单跳推理
基于神经网络的单跳推理的优点是能够通过利用神经网络强大的学习、推理能力来建模知识图谱三元组,但是神经网络的可解释性一直是一个很严重的问题。
(2)多跳推理
在神经网络的多跳推理中,主要有两种方法:通过神经网络建模多跳路径 和 模拟人脑的过程进行推理。前者充分学习多跳路径的表示,然后根据路径的表示和直接关系表示的相似度来得到得分;后者主要利用一个外部存储结构模拟人脑的存储,利用人脑的强大推理能力得到推理结果。
上述基于神经网络的多跳推理方法可解释性更强。
(1)混合规则和分布式表示的推理
使用分布式辅助规则,并加入了上下文关系,提出了上下文敏感的方法[1-55]。
通过矩阵分解直接学习一阶逻辑表示,首先从三元组训练集产生推理规则集合,然后将证明图转为一个矩阵,进行映射推理[1-56]。
KALE模型在一个统一框架中通过三元组和规则联合建模,将三元组和规则都形式化为对应的公式[1-57]。
(2)混合神经网络与分布式表示的推理
使用R-GCN建模知识图谱,并且通过邻居实体节点产生隐性特征向量表示,通过头实体向量的转置变量、关系对角矩阵与尾实体向量的乘积表示得分函数,通过模型的较差熵损失进行训练学习[1-58]。
(3)混合神经网络和规则的推理
Neural在TensorLog的基础上引入了注意力机制和外部存储的神经网络系统[1—59,13]。
链接预测是知识图谱补全的重要方法,而基于嵌入的方法对KG中的链接预测有效,但是对只有几个关联三元组的关系表现不佳。
基于深度学习的知识推理的主要思路是利用深度学习的分布式表示和深层架构来建模知识图谱的事实三元组。具体的,基于深度学习的知识推理依据知识的属性分别委基于知识表示学习的推理、基于知识推理依据的知识推理以及基于知识计算应用的推理。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。