首页--工业技术--自动化技术、计算机技术--计算技术、计算机技术--计算机的应用--信息处理（信息加工）--模式识别与装置

自然场景文本与非文本图片分类算法研究

自然场景图片论文文本与非文本图片分类论文最大值稳定区域论文卷积神经网络论文

论文详情

随着信息时代的爆发,越来越多的图像视频数据以各式各样的途径传播。与之伴随的新挑战是如何快速有效的从这些海量数据中获取有用信息。自然场景图像中的文字作为一种极其重要的信息来源,可以被用来辅助于多种实际应用包括图像检索、人机交互和驾驶导航系统等等,因此关于自然场景文本自动阅读相关技术(主要包含文字检测和文字识别)的研究一直是计算机领域备受关注的话题。然而,大规模的图像视频数据中只有极少部分的图片包含文字,因此关于文本与非文本图片分类算法的研究具备较高的现实意义和使用价值。本论文的主要研究内容如下:首先,为了解决自然场景文本与非文本分类算法缺乏公开的评测数据集问题,我们从网络上收集了一个大规模数据集并采纳了相应的衡量指标。数据集主要由自然场景图片,和极少量的数字合成图片和文档图片组成,图片中的文字在布局、字体、颜色和语种上丰富多样。该数据集可以作为参考数据集,用来衡量不同自然场景文本与非文本图片判别算法的性能。接着,从图像特征编码角度出发,论文提出了一个基于深度学习特征编码的自然场景文本与非文本图片分类算法(简称CNN Coding),有效的结合了最大值稳定区域、卷积神经网络和词袋模型三种成熟技术的优势。算法在自己创建的数据集上的评测性能比几种典型图像分类算法优越。和几种典型的图像分类算法比较分析,也有助于我们进一步探讨该问题的难点和本质需求。考虑算法的易用性、灵活性以及速度需求,论文也提出了一个基于多尺度空间划分文本与非文本图片判别的卷积神经网络(简称MSP-Net)。网络借助于多尺度空间划分操作,将图像级别的分类问题转变为图像块级别的分类问题。只要有一个以上的图像块被识别为文本块,整张图片就此被视作为文本图片。网络仅需要单次的前向传播,就可以把所有的图像块关于文本与非文本的判别结果输出。该网络模型在多个数据集上评测的性能和速度都远远超过其他的方法,包括LLC Coding方法,具有较强的通用性。论文解决了自然场景文本与非文本分类算法的几个关键性问题,如数据集和衡量指标等问题。通过分析问题难点和需求之后,提出的两种有效解决自然场景文本与非文本图片分类算法,能够成为海量图像视频数据中挖掘文本信息的有效工具。

摘要	第4-6页
ABSTRACT	第6-7页
第一章绪论	第10-17页
1.1 研究背景和意义	第10-11页
1.2 国内外研究现状	第11-14页
1.2.1 自然场景文本阅读相关技术研究	第11-12页
1.2.2 图像分类算法研究	第12-13页
1.2.3 文本与非文本图片分类算法研究	第13-14页
1.3 面临的主要难点和挑战	第14-15页
1.4 本文主要研究内容和创新点	第15-16页
1.5 论文结构安排	第16-17页
第二章自然场景文本与非文本图片数据集与评价标准	第17-22页
2.1 自然场景文字相关数据集	第17-18页
2.2 自然场景文本图片与非文本图片标准数据集创建	第18-20页
2.3 评价标准	第20-21页
2.4 本章小节	第21-22页
第三章基于深度学习特征编码的自然场景文本与非文本图片判别算法	第22-33页
3.1 算法概述	第22-23页
3.2 主要步骤及原理描述	第23-28页
3.2.1 文字候选区域提取及过滤	第23-24页
3.2.2 多类卷积神经网络模型训练	第24-27页
3.2.3 文本图片编码表示生成及分类器训练	第27-28页
3.3 实验部分	第28-32页
3.3.1 对比方法	第28-29页
3.3.2 实验结果和性能分析	第29-30页
3.3.3 影响参数讨论	第30-32页
3.4 本章小节	第32-33页
第四章基于多尺度空间划分文本与非文本图片判别的卷积神经网络	第33-51页
4.1 多尺度图像块级别文本与非文本区分	第34页
4.2 端到端卷多尺度空间划分积神经网络	第34-40页
4.2.1 MSP-Net网络结构	第35-36页
4.2.2 多层次特征图	第36-37页
4.2.3 多尺度空间划分	第37-38页
4.2.4 图像块级别特征描述及判别	第38-39页
4.2.5 网络训练	第39-40页
4.3 实验部分	第40-49页
4.3.1 实验设置	第40-42页
4.3.2 网络实施细节	第42-44页
4.3.3 实验结果分析	第44-48页
4.3.4 参数讨论及方法约束性分析	第48-49页
4.4 本章小节	第49-51页
第五章总结与展望	第51-54页
5.1 论文总结	第51-52页
5.2 后续工作展望	第52-54页
致谢	第54-55页
参考文献	第55-60页
攻读硕士学位期间公开发表的论文与科研项目成果	第60页

论文购买

论文编号ABS3332903，这篇论文共60页

会员购买按0.30元/页下载，共需支付18。

会员购买

不是会员，注册会员！
会员更优惠充值送钱！

直接购买按0.5元/页下载，共需要支付30。

直接购买

只需这篇论文，无需注册！
直接网上支付，方便快捷！