首页--工业技术--自动化技术、计算机技术--自动化基础理论--人工智能理论--专家系统、知识工程

基于模板学习和深度学习的知识抽取和表示学习的研究与应用

知识抽取论文关系抽取论文知识图谱论文概念图谱论文

论文详情

知识就是力量。知识对于人类的生活至关重要,同时知识也是人工智能的基石。形成知识的过程本质就是在建立认知乃至理解世界。因为人类有获取、形成以及升华知识的能力,所以人类才可以不断进步。目前来说,机器可以从海量的数据中学出感知能力,包括视觉能力、听觉能力和语言输出能力。但是让机器学会具备认知能力却是非常之难的,比如让机器学会逻辑推理能力以及举一反三能力对目前来说是不太现实的。我们的目标是使机器完全理解知识以至于能达到灵活应用的效果。将知识应用到人工智能应用中分为三个阶段:知识抽取、知识表示以及知识应用。知识抽取的目标是能够从大规模非结构化文本中自动地抽取结构化知识。目前知识抽取任务具有以下第(1)点不足。基于符号逻辑的知识表示对于人类来说是很好理解的。但是这种表示形式对于机器来说特别难理解。因此,近年来大量的工作开始研究分布式向量表示学习(又称嵌入表示学习)。对于概念图谱嵌入表示学习和知识图谱嵌入表示学习,目前具有以下第(2)点不足。关于知识应用方面,我们选择两个应用场景来验证我们的想法:相似问题检索以及关系分类。这两个工作在目前的学习过程中都没有好好的利用知识信息,目前来说具有以下第(3)点不足。(1)目前,知识库经常表示为三元组形式(主语,谓词,宾语)。然而在某些情况下给定主语和谓词,宾语并不是唯一的。传统的基于知识库的自动问答系统通常对具有相似意图但条件不同的问题提供相同的答案。(2)在目前的概念嵌入表示学习过程中,只有两个词出现在一个上下文窗口时,对应的概念信息才会被考虑。在知识图谱嵌入工作中,知识图谱中的逻辑结构信息有很强的推理能力,但是在目前的知识图谱嵌入工作中被忽略了。(3)目前没有一个框架能同时解决相似问题检索任务中五个方面的挑战:同义性、多义性、词序、问题长度和数据稀疏性。对于关系分类任务,现有的模型都将其视为一个普通的分类任务,而忽略了三元组信息。在本文中,我们提出了一系列解决上述局限性的方法。综上所述,本文的贡献如下:(1)为解决第一点缺陷,我们从问答数据和搜索日志中构建了条件型知识库,并搭建了一个基于条件型知识库的对话系统和用户进行聊天并补充用户提问中缺失的条件。同时我们提出了一种新的网络嵌入表示学习方法对具有两种不同关系的网络进行编码。(2)为解决第二点缺陷,我们提出了同时从依赖于上下文的视角和独立于上下文的视角来学习概念和词的向量表示。同时我们提出了一种基于逻辑结构分布式编码的知识图谱嵌入表示学习的框架来增强推理能力,它可以很容易地与任何基于翻译的知识图谱嵌入模型相结合。(3)为解决第三点缺陷,我们使用一个基于高阶特征嵌入表示~1的卷积语义模型直接学习问题向量表示。同时我们提出一种基于值卷积的注意力机制来加强卷积语义模型。最后,我们提出使用一种基于多视图学习的方法来训练卷积语义模型从而解决数据稀疏性问题。为了使知识图谱编码到关系分类中,我们提出了一种基于知识图谱驱动的关系分类方法。该方法可以很容易地与现有的基于pairwise排序损失函数的神经网络模型结合使用。同时我们提出一种数据增强的方法能够使用一个句子样本同时学习关系的向量表示以及逆向关系的向量表示。在把知识应用到人工智能应用的每个阶段中,我们进行了大量的实验并通过和多个基准模型对比来验证每个阶段中我们所提出的模型算法。我们的实验结果表明我们提出的方法均能提高相应任务的性能。

摘要	第5-7页
ABSTRACT	第7-8页
第一章绪论	第13-23页
1.1 研究背景	第13-15页
1.2 研究现状	第15-20页
1.2.1 知识抽取	第15-18页
1.2.2 知识表示	第18-20页
1.2.3 知识应用	第20页
1.3 本文工作和贡献	第20-21页
1.4 本文的组织和安排	第21-23页
第二章基于模板的条件型知识和医疗知识抽取	第23-65页
2.1 研究动机	第23-24页
2.2 条件型知识库抽取	第24-43页
2.2.1 引言	第24-27页
2.2.2 条件型知识库搭建	第27-35页
2.2.3 实验结果及分析	第35-43页
2.3 基于模版的医疗知识库抽取	第43-64页
2.3.1 引言	第43-45页
2.3.2 模板挖掘	第45-47页
2.3.3 额外关系对抽取	第47-48页
2.3.4 网络嵌入	第48-54页
2.3.5 实验结果及分析	第54-64页
2.4 本章小结	第64-65页
第三章概念图谱和知识图谱表示学习	第65-87页
3.1 研究动机	第65页
3.2 概念图谱表示学习	第65-72页
3.2.1 引言	第65-66页
3.2.2 词嵌入模型	第66页
3.2.3 概念驱动模型	第66-69页
3.2.4 实验结果及分析	第69-72页
3.3 基于逻辑结构分布式编码的知识图谱嵌入表示学习	第72-86页
3.3.1 引言	第72-73页
3.3.2 逻辑结构抽取	第73-76页
3.3.3 基于逻辑结构编码的知识图谱嵌入模型	第76-78页
3.3.4 全局目标函数	第78-79页
3.3.5 讨论	第79-80页
3.3.6 实验结果及分析	第80-86页
3.4 本章小结	第86-87页
第四章知识在问题检索以及关系分类中的应用	第87-117页
4.1 研究动机	第87页
4.2 知识表示在问题检索中的应用	第87-105页
4.2.1 引言	第87-89页
4.2.2 统一框架	第89页
4.2.3 句子表示学习	第89-96页
4.2.4 多视图学习	第96-98页
4.2.5 实验结果及分析	第98-104页
4.2.6 讨论	第104-105页
4.3 知识表示在关系分类中的应用	第105-115页
4.3.1 引言	第105-106页
4.3.2 框架	第106-112页
4.3.3 实验结果及分析	第112-115页
4.3.4 讨论	第115页
4.4 本章小结	第115-117页
第五章结论与展望	第117-120页
5.1 结论	第117-118页
5.2 展望	第118-120页
参考文献	第120-137页
攻读博士学位期间取得的研究成果	第137-139页
致谢	第139-140页
附件	第140页

论文购买

论文编号ABS4350235，这篇论文共140页

会员购买按0.30元/页下载，共需支付42。

会员购买

不是会员，注册会员！
会员更优惠充值送钱！

直接购买按0.5元/页下载，共需要支付70。

直接购买

只需这篇论文，无需注册！
直接网上支付，方便快捷！