用于自然语言分布式表达的联合学习方法研究

自然语言处理论文 神经网络论文 深度学习论文 分布式表达论文 嵌入向量论文 联合学习单词消歧义论文
论文详情
自然语言分布式表达(Distributed Representations of Natural Language)技术是指利用深度神经网络算法训练得到自然语言对象(单词、短语、句子、段落和文档等)的向量表达的技术,这种向量也被称为自然语言嵌入向量(Natural Language Embedding Vector)。一般来讲,分布式表达向量是从大规模无监督的语料中学习得来的低维、稠密实数值向量,因为其承载了该自然语言对象的语义信息,所以可以作为自然语言的一种有效的表达,应用于各项自然语言处理的任务中,并取得了非常优异的实际表现。在本论文中,与以往完全从原始文本语料学习(Learning From Scratch)得到自然语言分布式表达的方法不同,我们试图融入更多的信息,达到联合训练自然语言分布式表达向量的目的。这些信息有可能是外源信息(例如字典信息与知识图谱信息),也有可能是原始语料信息的其他抽象、或者高层次表达(例如单词的多义性信息与主题信息)。这种联合训练的方法一方面可以利用更多的信息提升原始分布式表达向量的质量,另外一方面可以利用自然语言的分布式表达更好地帮助相应的任务(例如主题建模),从而达到更佳的实际表现。具体来说,1)我们通过单词多义性信息与单词分布式表达联合训练的方法来克服传统单词分布式表达以单词作为基本语义嵌入单元的限制,所提出的算法可以精确表达多义单词的不同语义,取得了良好的实际效果,同时我们在本文中介绍了该算法的大规模并行实现:2)我们通过知识图谱表示与单词分布式表达联合训练的方法来克服原始文本驱动的单词嵌入向量无法表示复杂知识关系的限制;3)基于这两种联合训练的方式我们提出了一种利用单词分布式表达来完成自动智商测试的方法,在标准词汇智商测试任务上取得了比该测试的人类参与者的表现更高的准确率;4)更进一步,我们提出了一种基于递归神经网络(Recurrent Neural Network)的句子分布式表达模型和主题模型的联合训练方法,利用该方法训练得到的主题模型可以建模单词序列性信息,与忽略该信息的传统主题模型相比在定量任务和定性任务上都有更好的表现。
摘要第5-6页
ABSTRACT第6页
第一章 绪论第13-25页
    1.1 传统特征工程与深度表示学习第13-17页
    1.2 用于自然语言处理领域的深度学习第17-25页
第二章 自然语言分布式表达第25-43页
    2.1 深度学习第25-30页
        2.1.1 神经网络基本概念第25-28页
        2.1.2 深度表示学习第28-30页
    2.2 基于深度学习的自然语言分布式表达第30-43页
        2.2.1 单词分布式表达第30-34页
        2.2.2 句子分布式表达第34-40页
        2.2.3 段落、文档分布式表达第40-43页
第三章 单词分布式表达与单词消歧的联合学习第43-61页
    3.1 相关工作第44-45页
    3.2 用于建模单词多义性的Skip Gram Mixture算法第45-50页
        3.2.1 数学模型第45-47页
        3.2.2 EM训练算法第47-50页
        3.2.3 模型参数比较第50页
    3.3 实验结果第50-58页
        3.3.1 实验设置第51页
        3.3.2 定性实验第51-53页
        3.3.3 单词相似度任务第53-55页
        3.3.4 大规模并行实现第55-58页
    3.4 总结第58-61页
第四章 单词分布式表达与知识图谱表达的联合学习第61-79页
    4.1 背景介绍第61-66页
        4.1.1 知识图谱与知识图谱表示学习第62-66页
    4.2 ProjectNet算法第66-71页
        4.2.1 文本模型第66-67页
        4.2.2 知识模型第67-68页
        4.2.3 ProjectNet与其他模型的关系第68-71页
    4.3 实验结果第71-77页
        4.3.1 实验配置第71-72页
        4.3.2 单词语义推断(Analogical Reasoning)任务第72-76页
        4.3.3 单词相似度任务第76-77页
    4.4 总结第77-79页
第五章 联合学习单词分布式表达的应用——自动智商测试第79-97页
    5.1 背景介绍第79-81页
    5.2 标准智商测试第81-83页
        5.2.1 标准智商测试中的词汇问题第81-83页
    5.3 解决智商测试词汇问题的算法第83-89页
        5.3.1 问题类型分类第84页
        5.3.2 联合学习单词多义性和知识关系的分布式表达第84-87页
        5.3.3 每种问题类型的具体解法第87-89页
    5.4 词汇智商测试实验第89-94页
        5.4.1 数据收集第90页
        5.4.2 基准对比模型第90-92页
        5.4.3 实验结果第92-94页
    5.5 总结第94-97页
第六章 句子分布式表达与主题模型的联合学习第97-115页
    6.1 背景介绍第98-99页
    6.2 相关工作第99-101页
    6.3 句子层级递归主题模型第101-107页
        6.3.1 文档生成过程第102-104页
        6.3.2 随机变分推断和训练算法第104-107页
    6.4 实验结果第107-113页
        6.4.1 实验设置第108-109页
        6.4.2 文档建模任务第109-110页
        6.4.3 文档分类任务第110-111页
        6.4.4 主题代表句子生成第111-113页
    6.5 总结第113-115页
第七章 总结与展望第115-119页
参考文献第119-127页
致谢第127-129页
在读期间发表的学术论文第129页
论文购买
论文编号ABS3937850,这篇论文共129页
会员购买按0.30元/页下载,共需支付38.7
不是会员,注册会员
会员更优惠充值送钱
直接购买按0.5元/页下载,共需要支付64.5
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文

点击收藏 | 在线购卡 | 站内搜索 | 网站地图
版权所有 艾博士论文 Copyright(C) All Rights Reserved
版权申明:本文摘要目录由会员***投稿,艾博士论文编辑,如作者需要删除论文目录请通过QQ告知我们,承诺24小时内删除。
联系方式: QQ:277865656