自然场景文本与非文本图片分类算法研究

自然场景图片论文 文本与非文本图片分类论文 最大值稳定区域论文 卷积神经网络论文
论文详情
随着信息时代的爆发,越来越多的图像视频数据以各式各样的途径传播。与之伴随的新挑战是如何快速有效的从这些海量数据中获取有用信息。自然场景图像中的文字作为一种极其重要的信息来源,可以被用来辅助于多种实际应用包括图像检索、人机交互和驾驶导航系统等等,因此关于自然场景文本自动阅读相关技术(主要包含文字检测和文字识别)的研究一直是计算机领域备受关注的话题。然而,大规模的图像视频数据中只有极少部分的图片包含文字,因此关于文本与非文本图片分类算法的研究具备较高的现实意义和使用价值。本论文的主要研究内容如下:首先,为了解决自然场景文本与非文本分类算法缺乏公开的评测数据集问题,我们从网络上收集了一个大规模数据集并采纳了相应的衡量指标。数据集主要由自然场景图片,和极少量的数字合成图片和文档图片组成,图片中的文字在布局、字体、颜色和语种上丰富多样。该数据集可以作为参考数据集,用来衡量不同自然场景文本与非文本图片判别算法的性能。接着,从图像特征编码角度出发,论文提出了一个基于深度学习特征编码的自然场景文本与非文本图片分类算法(简称CNN Coding),有效的结合了最大值稳定区域、卷积神经网络和词袋模型三种成熟技术的优势。算法在自己创建的数据集上的评测性能比几种典型图像分类算法优越。和几种典型的图像分类算法比较分析,也有助于我们进一步探讨该问题的难点和本质需求。考虑算法的易用性、灵活性以及速度需求,论文也提出了一个基于多尺度空间划分文本与非文本图片判别的卷积神经网络(简称MSP-Net)。网络借助于多尺度空间划分操作,将图像级别的分类问题转变为图像块级别的分类问题。只要有一个以上的图像块被识别为文本块,整张图片就此被视作为文本图片。网络仅需要单次的前向传播,就可以把所有的图像块关于文本与非文本的判别结果输出。该网络模型在多个数据集上评测的性能和速度都远远超过其他的方法,包括LLC Coding方法,具有较强的通用性。论文解决了自然场景文本与非文本分类算法的几个关键性问题,如数据集和衡量指标等问题。通过分析问题难点和需求之后,提出的两种有效解决自然场景文本与非文本图片分类算法,能够成为海量图像视频数据中挖掘文本信息的有效工具。
摘要第4-6页
ABSTRACT第6-7页
第一章 绪论第10-17页
    1.1 研究背景和意义第10-11页
    1.2 国内外研究现状第11-14页
        1.2.1 自然场景文本阅读相关技术研究第11-12页
        1.2.2 图像分类算法研究第12-13页
        1.2.3 文本与非文本图片分类算法研究第13-14页
    1.3 面临的主要难点和挑战第14-15页
    1.4 本文主要研究内容和创新点第15-16页
    1.5 论文结构安排第16-17页
第二章 自然场景文本与非文本图片数据集与评价标准第17-22页
    2.1 自然场景文字相关数据集第17-18页
    2.2 自然场景文本图片与非文本图片标准数据集创建第18-20页
    2.3 评价标准第20-21页
    2.4 本章小节第21-22页
第三章 基于深度学习特征编码的自然场景文本与非文本图片判别算法第22-33页
    3.1 算法概述第22-23页
    3.2 主要步骤及原理描述第23-28页
        3.2.1 文字候选区域提取及过滤第23-24页
        3.2.2 多类卷积神经网络模型训练第24-27页
        3.2.3 文本图片编码表示生成及分类器训练第27-28页
    3.3 实验部分第28-32页
        3.3.1 对比方法第28-29页
        3.3.2 实验结果和性能分析第29-30页
        3.3.3 影响参数讨论第30-32页
    3.4 本章小节第32-33页
第四章 基于多尺度空间划分文本与非文本图片判别的卷积神经网络第33-51页
    4.1 多尺度图像块级别文本与非文本区分第34页
    4.2 端到端卷多尺度空间划分积神经网络第34-40页
        4.2.1 MSP-Net网络结构第35-36页
        4.2.2 多层次特征图第36-37页
        4.2.3 多尺度空间划分第37-38页
        4.2.4 图像块级别特征描述及判别第38-39页
        4.2.5 网络训练第39-40页
    4.3 实验部分第40-49页
        4.3.1 实验设置第40-42页
        4.3.2 网络实施细节第42-44页
        4.3.3 实验结果分析第44-48页
        4.3.4 参数讨论及方法约束性分析第48-49页
    4.4 本章小节第49-51页
第五章 总结与展望第51-54页
    5.1 论文总结第51-52页
    5.2 后续工作展望第52-54页
致谢第54-55页
参考文献第55-60页
攻读硕士学位期间公开发表的论文与科研项目成果第60页
论文购买
论文编号ABS3332903,这篇论文共60页
会员购买按0.30元/页下载,共需支付18
不是会员,注册会员
会员更优惠充值送钱
直接购买按0.5元/页下载,共需要支付30
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文

点击收藏 | 在线购卡 | 站内搜索 | 网站地图
版权所有 艾博士论文 Copyright(C) All Rights Reserved
版权申明:本文摘要目录由会员***投稿,艾博士论文编辑,如作者需要删除论文目录请通过QQ告知我们,承诺24小时内删除。
联系方式: QQ:277865656