基于MLP和区域分析的自然场景文本定位方法研究

文本定位论文 MLP网络论文 投影论文
论文详情
随着数字科技的迅速发展,从彩色图像中提取文本信息的研究越来越受到人们的关注。图像中的文本信息可以作为图像资料的自动注释、索引、压缩等方面的重要参考。在过去的40年里,文档图像处理和理解已经有了广泛、深入的研究。这个领域的工作覆盖了许多不同的方面,包括预处理、物理的和逻辑的排列分析、OCR/ICR、图像分析、签名验证和作者识别等,而且在很多领域被应用,如办公自动化、数字图书馆等。通常情况下,研究者根据文本对象的存在形式将图像中的文本分为人工文本和场景文本。在传统的识别方法中,文档图像是通过扫描纸张得到的,这些文本主要是人工文本。对于人工文本的研究已经有大量的文献。近来,人们越来越倾向于使用数码相机、数码摄像机等数字设备得到文档图像或者获得场景图像,这就对文本提取领域提出了新的问题。本文针对自然场景中的文本区域定位这个问题来进行研究,包含预处理、特征提取、分类器分类、候选文本区域生成和候选文本区域分析五个步骤。在特征提取和分类器分类阶段,我们使用方形区域内“米”形范围内像素点的灰度值作为输入特征并使用MLP网络将像素点分为文本像素点和非文本像素点,该方法避开了特征构造和选择的复杂阶段。在候选文本区域生成阶段,我们针对MLP网络对像素点分类后得到的二值图像的特点提出了使用投影法产生候选文本区域的方法。投影法与传统的使用连通域生成候选文本区域的方法相比,可以避免出现区域重叠、覆盖的情况,避免生成小的虚假文本区域,有效的减少了冗余文本区域的数目,简化了后期处理。在候选文本区域分析阶段,我们提出了使用频率分析来剔除非文本区域提高定位准确率的方法。实验结果表明,使用频率分析有效的提高了定位准确率。本文的方法根据MLP网络的输出确定每个像素点的属性,然后使用投影法从上一阶段得到的结果生成候选文本区域,最后对候选文本区域进行分析,剔除其中的非文本区域。实验结果表明我们的方法可以获得好的文本定位结果,得到了较为理想的评价指标。
摘要第4-5页
Abstract第5-6页
第1章 绪论第9-16页
    1.1 本课题研究的背景和意义第9-11页
    1.2 本课题的有关领域现状第11-14页
        1.2.1 预处理和特征提取第11-12页
        1.2.2 分类器的设计第12-13页
        1.2.3 候选区域的选取与后处理第13页
        1.2.4 文本定位算法的评价第13-14页
    1.3 本课题的主要研究内容第14-16页
第2章 特征提取的研究第16-27页
    2.1 PCA 的概念第16-20页
        2.1.1 PCA 的基本原理第17-18页
        2.1.2 计算步骤第18-20页
    2.2 fisher 线性变换第20-22页
    2.3 特征提取第22页
    2.4 结果分析第22-26页
        2.4.1 可分性判据第23-24页
        2.4.2 三种方法的比较第24-26页
    2.5 本章小结第26-27页
第3章 分类器设计与像素点分类方法第27-45页
    3.1 神经网络基础第27-30页
        3.1.1 感知器第28页
        3.1.2 MLP 网络第28-30页
    3.2 MLP 网络设计第30-34页
        3.2.1 窗口大小对识别结果的影响第30-31页
        3.2.2 MLP 网络结构对识别结果的影响第31-32页
        3.2.3 MLP 网络结构设计第32-34页
    3.3 MLP 网络训练第34-36页
        3.3.1 训练样本对网络识别结果的影响第35页
        3.3.2 MLP 网络训练方法第35-36页
    3.4 像素点分类第36-44页
        3.4.1 阈值与合并方法对分类结果的影响第36-38页
        3.4.2 使用间隔扫描减少运行时间第38-40页
        3.4.3 不同平滑方法的比较第40-44页
    3.5 本章小结第44-45页
第4章 文本区域定位第45-54页
    4.1 生成候选文本区域第45-48页
    4.2 候选文本区域分析与处理第48-51页
        4.2.1 候选文本区域初步分析第48-50页
        4.2.2 候选文本区域合并第50页
        4.2.3 候选文本区域频率分析第50-51页
    4.3 文本区域定位效果分析第51-53页
        4.3.1 评价准则第51-52页
        4.3.2 文本区域定位结果比较第52-53页
    4.4 本章小结第53-54页
第5章 整体评价第54-59页
    5.1 整体结构第54页
    5.2 系统分析与评估第54-58页
    5.3 本章小结第58-59页
结论第59-60页
参考文献第60-64页
攻读硕士学位期间发表的学术论文第64-66页
致谢第66页
论文购买
论文编号ABS2160810,这篇论文共66页
会员购买按0.30元/页下载,共需支付19.8
不是会员,注册会员
会员更优惠充值送钱
直接购买按0.5元/页下载,共需要支付33
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文

点击收藏 | 在线购卡 | 站内搜索 | 网站地图
版权所有 艾博士论文 Copyright(C) All Rights Reserved
版权申明:本文摘要目录由会员***投稿,艾博士论文编辑,如作者需要删除论文目录请通过QQ告知我们,承诺24小时内删除。
联系方式: QQ:277865656