基于SLIC和OTSU的自然场景文本分割方法研究

自然场景图像论文 超像素论文 最大类间方差论文
论文详情
随着各种具有摄像功能的移动电子设备的普及,越来越多的信息以自然场景图像为载体而存在。图像中文本信息对于理解场景、认知场景图像具有相当重要的意义。自然场景图像中的文本识别可以分为三个步骤,文本定位、文本分割、字符识别。首先要在自然场景图像中找到文本区域的位置,其次将文本从图像背景中分离出来,最后对分离出的文本进行字符识别,从而达到文本识别的目标。自然场景图像中存在颜色多变、光照不均、背景复杂等问题,这些问题会使文本的分割过程存在很大的挑战。基于阈值的方法在自然场景文本分割中比较常见,但通常只利用灰度值信息进行二值化,没有考虑像素点的空间信息。本文针对这个问题,提出了基于超像素和最大类间方差算法的文本分割方法,通过超像素信息将像素的空间信息应用到图像二值化的过程中,然后使用tesseract方法对文本分割结果进行识别,以验证本文提出的文本分割方法的有效性。首先对自然场景图像使用SLIC(简单线性迭代聚类)算法生成超像素标记,对图像进行过分割。然后对同一幅图像进行灰度化、均衡化、去噪,使用OTSU(最大类间方差法)进行二值化。再结合过分割图像和二值化结果,得到最终的文本分割结果。关于字符识别步骤,针对自然场景文本,对tesseract引擎进行相应的训练,然后使用训练之后的tesseract引擎对文本分割结果进行识别,再通过设计的识别结果修正环节得到最终的识别结果。最后,通过比较本文的文本分割结果与其他方法得到的文本分割结果在tesseract方法下的识别率,来比较文本分割结果的优劣。本文采用ICDAR 2013自然场景图像的数据集对本文的文本分割方法进行检验,通过使用tesseract方法对分割结果进行识别来检验文本分割结果。实验证明本文提出的基于SLIC和OTSU的文本分割方法取得了较为理想的分割结果。
摘要第5-6页
ABSTRACT第6页
1 概述第9-18页
    1.1 研究背景和意义第9-10页
    1.2 自然场景图像文本识别第10-12页
        1.2.1 自然场景图像文本第10-11页
        1.2.2 自然场景文本分割难点第11-12页
    1.3 国内外研究现状及趋势第12-16页
        1.3.1 文本分割第12-15页
        1.3.2 字符识别第15-16页
    1.4 本文研究目标与内容第16-18页
2 基于SLIC和OTSU的自然场景文本分割方法第18-33页
    2.1 文本分割方法第18-19页
    2.2 超像素预处理第19-23页
        2.2.1 超像素算法分类第20-21页
        2.2.2 SLIC超像素算法原理第21-23页
    2.3 图像预处理第23-26页
        2.3.1 彩色图像灰度化方法第23-24页
        2.3.2 直方图均衡化第24-25页
        2.3.3 图像噪声处理第25-26页
    2.4 图像二值化处理第26-30页
        2.4.1 全局阈值法第26-27页
        2.4.2 局部阈值法第27-28页
        2.4.3 OTSU二值化第28-30页
    2.5 文本分割实验第30-33页
3 基于TESSERACT的字符识别方法第33-47页
    3.1 TESSERACT字符识别原理第33-38页
        3.1.1 文本行及单词的确定第34-36页
        3.1.2 单词的识别第36-37页
        3.1.3 静态字符分类器第37-38页
    3.2 TESSERACT训练流程第38-47页
4 实验及结果分析第47-55页
    4.1 实验数据集与评价方法第47-48页
        4.1.1 实验数据集第47-48页
        4.1.2 评价方法第48页
    4.2 实验分析第48-55页
        4.2.1 SLIC超像素生成第49-51页
        4.2.2 识别结果的修正第51-52页
        4.2.3 文本分割方法比较第52-55页
5 研究总结与展望第55-57页
    5.1 研究总结第55-56页
    5.2 研究展望第56-57页
参考文献第57-61页
攻硕期间发表的科研成果目录第61-62页
致谢第62页
论文购买
论文编号ABS4155025,这篇论文共62页
会员购买按0.30元/页下载,共需支付18.6
不是会员,注册会员
会员更优惠充值送钱
直接购买按0.5元/页下载,共需要支付31
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文

点击收藏 | 在线购卡 | 站内搜索 | 网站地图
版权所有 艾博士论文 Copyright(C) All Rights Reserved
版权申明:本文摘要目录由会员***投稿,艾博士论文编辑,如作者需要删除论文目录请通过QQ告知我们,承诺24小时内删除。
联系方式: QQ:277865656