首页--工业技术--自动化技术、计算机技术--计算技术、计算机技术--计算机的应用--信息处理（信息加工）--文字信息处理

用于自然语言分布式表达的联合学习方法研究

自然语言处理论文神经网络论文深度学习论文分布式表达论文嵌入向量论文联合学习单词消歧义论文

论文详情

自然语言分布式表达(Distributed Representations of Natural Language)技术是指利用深度神经网络算法训练得到自然语言对象(单词、短语、句子、段落和文档等)的向量表达的技术,这种向量也被称为自然语言嵌入向量(Natural Language Embedding Vector)。一般来讲,分布式表达向量是从大规模无监督的语料中学习得来的低维、稠密实数值向量,因为其承载了该自然语言对象的语义信息,所以可以作为自然语言的一种有效的表达,应用于各项自然语言处理的任务中,并取得了非常优异的实际表现。在本论文中,与以往完全从原始文本语料学习(Learning From Scratch)得到自然语言分布式表达的方法不同,我们试图融入更多的信息,达到联合训练自然语言分布式表达向量的目的。这些信息有可能是外源信息(例如字典信息与知识图谱信息),也有可能是原始语料信息的其他抽象、或者高层次表达(例如单词的多义性信息与主题信息)。这种联合训练的方法一方面可以利用更多的信息提升原始分布式表达向量的质量,另外一方面可以利用自然语言的分布式表达更好地帮助相应的任务(例如主题建模),从而达到更佳的实际表现。具体来说,1)我们通过单词多义性信息与单词分布式表达联合训练的方法来克服传统单词分布式表达以单词作为基本语义嵌入单元的限制,所提出的算法可以精确表达多义单词的不同语义,取得了良好的实际效果,同时我们在本文中介绍了该算法的大规模并行实现：2)我们通过知识图谱表示与单词分布式表达联合训练的方法来克服原始文本驱动的单词嵌入向量无法表示复杂知识关系的限制；3)基于这两种联合训练的方式我们提出了一种利用单词分布式表达来完成自动智商测试的方法,在标准词汇智商测试任务上取得了比该测试的人类参与者的表现更高的准确率；4)更进一步,我们提出了一种基于递归神经网络(Recurrent Neural Network)的句子分布式表达模型和主题模型的联合训练方法,利用该方法训练得到的主题模型可以建模单词序列性信息,与忽略该信息的传统主题模型相比在定量任务和定性任务上都有更好的表现。

摘要	第5-6页
ABSTRACT	第6页
第一章绪论	第13-25页
1.1 传统特征工程与深度表示学习	第13-17页
1.2 用于自然语言处理领域的深度学习	第17-25页
第二章自然语言分布式表达	第25-43页
2.1 深度学习	第25-30页
2.1.1 神经网络基本概念	第25-28页
2.1.2 深度表示学习	第28-30页
2.2 基于深度学习的自然语言分布式表达	第30-43页
2.2.1 单词分布式表达	第30-34页
2.2.2 句子分布式表达	第34-40页
2.2.3 段落、文档分布式表达	第40-43页
第三章单词分布式表达与单词消歧的联合学习	第43-61页
3.1 相关工作	第44-45页
3.2 用于建模单词多义性的Skip Gram Mixture算法	第45-50页
3.2.1 数学模型	第45-47页
3.2.2 EM训练算法	第47-50页
3.2.3 模型参数比较	第50页
3.3 实验结果	第50-58页
3.3.1 实验设置	第51页
3.3.2 定性实验	第51-53页
3.3.3 单词相似度任务	第53-55页
3.3.4 大规模并行实现	第55-58页
3.4 总结	第58-61页
第四章单词分布式表达与知识图谱表达的联合学习	第61-79页
4.1 背景介绍	第61-66页
4.1.1 知识图谱与知识图谱表示学习	第62-66页
4.2 ProjectNet算法	第66-71页
4.2.1 文本模型	第66-67页
4.2.2 知识模型	第67-68页
4.2.3 ProjectNet与其他模型的关系	第68-71页
4.3 实验结果	第71-77页
4.3.1 实验配置	第71-72页
4.3.2 单词语义推断(Analogical Reasoning)任务	第72-76页
4.3.3 单词相似度任务	第76-77页
4.4 总结	第77-79页
第五章联合学习单词分布式表达的应用——自动智商测试	第79-97页
5.1 背景介绍	第79-81页
5.2 标准智商测试	第81-83页
5.2.1 标准智商测试中的词汇问题	第81-83页
5.3 解决智商测试词汇问题的算法	第83-89页
5.3.1 问题类型分类	第84页
5.3.2 联合学习单词多义性和知识关系的分布式表达	第84-87页
5.3.3 每种问题类型的具体解法	第87-89页
5.4 词汇智商测试实验	第89-94页
5.4.1 数据收集	第90页
5.4.2 基准对比模型	第90-92页
5.4.3 实验结果	第92-94页
5.5 总结	第94-97页
第六章句子分布式表达与主题模型的联合学习	第97-115页
6.1 背景介绍	第98-99页
6.2 相关工作	第99-101页
6.3 句子层级递归主题模型	第101-107页
6.3.1 文档生成过程	第102-104页
6.3.2 随机变分推断和训练算法	第104-107页
6.4 实验结果	第107-113页
6.4.1 实验设置	第108-109页
6.4.2 文档建模任务	第109-110页
6.4.3 文档分类任务	第110-111页
6.4.4 主题代表句子生成	第111-113页
6.5 总结	第113-115页
第七章总结与展望	第115-119页
参考文献	第119-127页
致谢	第127-129页
在读期间发表的学术论文	第129页

论文购买

论文编号ABS3937850，这篇论文共129页

会员购买按0.30元/页下载，共需支付38.7。

会员购买

不是会员，注册会员！
会员更优惠充值送钱！

直接购买按0.5元/页下载，共需要支付64.5。

直接购买

只需这篇论文，无需注册！
直接网上支付，方便快捷！