基于模板学习和深度学习的知识抽取和表示学习的研究与应用

知识抽取论文 关系抽取论文 知识图谱论文 概念图谱论文
论文详情
知识就是力量。知识对于人类的生活至关重要,同时知识也是人工智能的基石。形成知识的过程本质就是在建立认知乃至理解世界。因为人类有获取、形成以及升华知识的能力,所以人类才可以不断进步。目前来说,机器可以从海量的数据中学出感知能力,包括视觉能力、听觉能力和语言输出能力。但是让机器学会具备认知能力却是非常之难的,比如让机器学会逻辑推理能力以及举一反三能力对目前来说是不太现实的。我们的目标是使机器完全理解知识以至于能达到灵活应用的效果。将知识应用到人工智能应用中分为三个阶段:知识抽取、知识表示以及知识应用。知识抽取的目标是能够从大规模非结构化文本中自动地抽取结构化知识。目前知识抽取任务具有以下第(1)点不足。基于符号逻辑的知识表示对于人类来说是很好理解的。但是这种表示形式对于机器来说特别难理解。因此,近年来大量的工作开始研究分布式向量表示学习(又称嵌入表示学习)。对于概念图谱嵌入表示学习和知识图谱嵌入表示学习,目前具有以下第(2)点不足。关于知识应用方面,我们选择两个应用场景来验证我们的想法:相似问题检索以及关系分类。这两个工作在目前的学习过程中都没有好好的利用知识信息,目前来说具有以下第(3)点不足。(1)目前,知识库经常表示为三元组形式(主语,谓词,宾语)。然而在某些情况下给定主语和谓词,宾语并不是唯一的。传统的基于知识库的自动问答系统通常对具有相似意图但条件不同的问题提供相同的答案。(2)在目前的概念嵌入表示学习过程中,只有两个词出现在一个上下文窗口时,对应的概念信息才会被考虑。在知识图谱嵌入工作中,知识图谱中的逻辑结构信息有很强的推理能力,但是在目前的知识图谱嵌入工作中被忽略了。(3)目前没有一个框架能同时解决相似问题检索任务中五个方面的挑战:同义性、多义性、词序、问题长度和数据稀疏性。对于关系分类任务,现有的模型都将其视为一个普通的分类任务,而忽略了三元组信息。在本文中,我们提出了一系列解决上述局限性的方法。综上所述,本文的贡献如下:(1)为解决第一点缺陷,我们从问答数据和搜索日志中构建了条件型知识库,并搭建了一个基于条件型知识库的对话系统和用户进行聊天并补充用户提问中缺失的条件。同时我们提出了一种新的网络嵌入表示学习方法对具有两种不同关系的网络进行编码。(2)为解决第二点缺陷,我们提出了同时从依赖于上下文的视角和独立于上下文的视角来学习概念和词的向量表示。同时我们提出了一种基于逻辑结构分布式编码的知识图谱嵌入表示学习的框架来增强推理能力,它可以很容易地与任何基于翻译的知识图谱嵌入模型相结合。(3)为解决第三点缺陷,我们使用一个基于高阶特征嵌入表示~1的卷积语义模型直接学习问题向量表示。同时我们提出一种基于值卷积的注意力机制来加强卷积语义模型。最后,我们提出使用一种基于多视图学习的方法来训练卷积语义模型从而解决数据稀疏性问题。为了使知识图谱编码到关系分类中,我们提出了一种基于知识图谱驱动的关系分类方法。该方法可以很容易地与现有的基于pairwise排序损失函数的神经网络模型结合使用。同时我们提出一种数据增强的方法能够使用一个句子样本同时学习关系的向量表示以及逆向关系的向量表示。在把知识应用到人工智能应用的每个阶段中,我们进行了大量的实验并通过和多个基准模型对比来验证每个阶段中我们所提出的模型算法。我们的实验结果表明我们提出的方法均能提高相应任务的性能。
摘要第5-7页
ABSTRACT第7-8页
第一章 绪论第13-23页
    1.1 研究背景第13-15页
    1.2 研究现状第15-20页
        1.2.1 知识抽取第15-18页
        1.2.2 知识表示第18-20页
        1.2.3 知识应用第20页
    1.3 本文工作和贡献第20-21页
    1.4 本文的组织和安排第21-23页
第二章 基于模板的条件型知识和医疗知识抽取第23-65页
    2.1 研究动机第23-24页
    2.2 条件型知识库抽取第24-43页
        2.2.1 引言第24-27页
        2.2.2 条件型知识库搭建第27-35页
        2.2.3 实验结果及分析第35-43页
    2.3 基于模版的医疗知识库抽取第43-64页
        2.3.1 引言第43-45页
        2.3.2 模板挖掘第45-47页
        2.3.3 额外关系对抽取第47-48页
        2.3.4 网络嵌入第48-54页
        2.3.5 实验结果及分析第54-64页
    2.4 本章小结第64-65页
第三章 概念图谱和知识图谱表示学习第65-87页
    3.1 研究动机第65页
    3.2 概念图谱表示学习第65-72页
        3.2.1 引言第65-66页
        3.2.2 词嵌入模型第66页
        3.2.3 概念驱动模型第66-69页
        3.2.4 实验结果及分析第69-72页
    3.3 基于逻辑结构分布式编码的知识图谱嵌入表示学习第72-86页
        3.3.1 引言第72-73页
        3.3.2 逻辑结构抽取第73-76页
        3.3.3 基于逻辑结构编码的知识图谱嵌入模型第76-78页
        3.3.4 全局目标函数第78-79页
        3.3.5 讨论第79-80页
        3.3.6 实验结果及分析第80-86页
    3.4 本章小结第86-87页
第四章 知识在问题检索以及关系分类中的应用第87-117页
    4.1 研究动机第87页
    4.2 知识表示在问题检索中的应用第87-105页
        4.2.1 引言第87-89页
        4.2.2 统一框架第89页
        4.2.3 句子表示学习第89-96页
        4.2.4 多视图学习第96-98页
        4.2.5 实验结果及分析第98-104页
        4.2.6 讨论第104-105页
    4.3 知识表示在关系分类中的应用第105-115页
        4.3.1 引言第105-106页
        4.3.2 框架第106-112页
        4.3.3 实验结果及分析第112-115页
        4.3.4 讨论第115页
    4.4 本章小结第115-117页
第五章 结论与展望第117-120页
    5.1 结论第117-118页
    5.2 展望第118-120页
参考文献第120-137页
攻读博士学位期间取得的研究成果第137-139页
致谢第139-140页
附件第140页
论文购买
论文编号ABS4350235,这篇论文共140页
会员购买按0.30元/页下载,共需支付42
不是会员,注册会员
会员更优惠充值送钱
直接购买按0.5元/页下载,共需要支付70
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文

点击收藏 | 在线购卡 | 站内搜索 | 网站地图
版权所有 艾博士论文 Copyright(C) All Rights Reserved
版权申明:本文摘要目录由会员***投稿,艾博士论文编辑,如作者需要删除论文目录请通过QQ告知我们,承诺24小时内删除。
联系方式: QQ:277865656