首页--工业技术--自动化技术、计算机技术--计算技术、计算机技术--计算机的应用--信息处理（信息加工）--模式识别与装置

基于卷积神经网络的LDA视频检索的研究

视频检索论文卷积神经网络论文潜在狄利克雷分布论文

论文详情

卷积神经网络(Convolutional Neural Network, CNN)在图像视频分析中比传统方法有更高的准确率和快速的处理速度,利用CNN进行视频特征生成是一个重要方向。隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)主题模型不仅在文本领域得到广泛应用,并且近来在图像处理领域也得到应用。本文结合LDA提出了视觉主题模型,定义视觉字和视觉主题,降低视频的维度。本文设计了基于卷积神经网络的LDA视频检索系统,并研究了系统实现过程中的视频特征生成、视频特征表示等方法,最后对系统进行了实现和性能比较。本文的主要工作和研究的重点内容如下:(1)视频具有数据量大的特点,需要进行大量预处理降低数据量。本文通过抽取视频关键帧,可以简化视频的内容。本文使用块划分方法选取出一帧中信息量大的目标对象块,进一步简化视频结构。(2)简化视频结构后,需要提取视频的底层特征。目前主流的视频底层特征如颜色直方图,没有形状、纹理等信息并且对颜色的改变比较敏感。局部特征可以采集目标对象信息,但直接计算视频间相似性比较耗时。本文采用卷积神经网络方法,对视频进行底层特征提取,保留更多的视觉信息,提高视频检索的性能。(3) CNN视频特征维度较高,直接用于检索计算量大,需要进行数据降维。词袋模型Bag of Words (BoW)可以将视频特征运用聚类算法映射到词语空间,获得视频的视觉词语表示。在此基础上本文利用LDA提出了狄利克雷视觉主题模型,可以将视觉词语映射到视觉主题空间,获得视频的主题概率分布,进一步简化视频表示。(4)本文设计和实现了基于卷积神经网络的LDA视频检索系统,并将所提出的方法与前沿BoW视频检索方法进行对比分析,根据实验结果分析证明本文方案具有可行性、通用性、高效性。

摘要	第5-6页
ABSTRACT	第6-7页
第一章绪论	第10-18页
1.1 研究背景	第10-11页
1.2 国内外研究现状	第11-15页
1.3 论文研究难点和创新点	第15-17页
1.3.1 视频检索的研究难点	第15-16页
1.3.2 论文的创新点	第16-17页
1.4 论文的主要内容及章节安排	第17-18页
第二章传统视频检索方法	第18-26页
2.1 视频检索框架	第18-19页
2.2 底层视频特征提取	第19-21页
2.2.1 尺度不变特征变换特征提取方法	第20-21页
2.2.2 卷积神经网络特征提取方法	第21页
2.3 视频特征生成	第21-23页
2.3.1 传统视频特征生成方法	第22页
2.3.2 时间序列视频特征生成	第22页
2.3.3 关键帧特征生成方法	第22-23页
2.4 本章小结	第23-26页
第三章基于卷积神经网络的底层视频特征提取	第26-36页
3.1 卷积神经网络基本介绍	第26-28页
3.2 LeNet-5网络	第28-32页
3.3 Siamese网络	第32-34页
3.4 本章小结	第34-36页
第四章潜在狄利克雷视觉主题模型算法	第36-42页
4.1 潜在狄利克雷主题模型算法介绍	第36-38页
4.2 潜在狄利克雷主题模型隐含参数求解	第38-39页
4.3 视觉主题空间特征形成	第39-41页
4.4 本章小结	第41-42页
第五章基于卷积神经网络的LDA视频检索方法	第42-60页
5.1 基于卷积神经网络的视频检索方案	第42-48页
5.1.1 视频特征生成	第43-45页
5.1.2 CNN特征提取	第45-46页
5.1.3 形成视觉词空间	第46-47页
5.1.4 视觉主题空间映射	第47页
5.1.5 视觉主题空间检索	第47-48页
5.2 实验和结果分析	第48-59页
5.2.1 单数据集检索实验	第49-52页
5.2.2 多数据集检索实验	第52-57页
5.2.3 视频数据集检索	第57-59页
5.3 本章小结	第59-60页
第六章总结与展望	第60-62页
6.1 论文工作总结	第60页
6.2 问题与展望	第60-62页
参考文献	第62-66页
致谢	第66-68页
攻读学位期间发表的学术论文目录	第68页

论文购买

论文编号ABS3678494，这篇论文共68页

会员购买按0.30元/页下载，共需支付20.4。

会员购买

不是会员，注册会员！
会员更优惠充值送钱！

直接购买按0.5元/页下载，共需要支付34。

直接购买

只需这篇论文，无需注册！
直接网上支付，方便快捷！