复杂场景中目标识别与分类的仿生原理和方法

高维空间仿生信息学论文 图像理解论文 目标识别与分类论文 SVM分类器论文 人体行为识别论文
论文详情
图像理解是以图像为研究对象,以人类知识为核心,主要研究图像中有什么目标、目标之间的相互关系、图像是什么场景以及如何应用场景的一门科学。其主要研究方向有场景中目标的分类与识别、场景描述与理解两个方面。其中,目标识别是为了对场景进行更好的解释,是场景描述与理解的基础,具有主动性。场景描述与理解为目标识别提供先验信息,可以指导目标识别。从本质上说,图像理解源于计算机视觉,但也融合了人工智能和认知学领域的知识信息,是与计算机视觉、人工智能和认知学相互关联又相互独立的研究领域。目标识别作为图像理解的基础,已应用于身份确定、智能交通管理、机动车辆检测等领域。目标识别的任务是使计算机具有对视觉图像进行复杂背景下检测、识别目标并进行分类的能力。但目前用于目标识别的模板匹配、边缘检测和统计等方法都缺乏生物视觉系统的智能性。自20世纪90年代开始,王守觉院士研究分析了人类认识事物的过程,总结出了同源样本的连续性规律,并称之为同源连续性原理,然后将此原理应用到模式识别中,提出了仿生模式识别方法,并由此形成了高维空间仿生信息学理论,该理论的提出为如何利用计算机解决形象思维问题开辟了一个新途径。本文从研究生物视觉系统的工作机理出发,结合王守觉院士关于高维空间仿生信息学的相关理论,构建相应的计算机模型,研究了图像理解中的目标识别与分类问题,针对不同场景提出了多种目标分类与识别方法。实验结果表明,本文提出的复杂场景中目标的特征提取模型以及在此基础上提出的仿生识别与分类方法有效可行。本文的主要工作总结如下。(1)应用神经生物学知识,对物体识别中涉及的各个脑区分别建模,提出了一种基于视皮层不变性识别机制的类表象仿生构建方法;并利用真实图像组成的训练集和测试集对模型和算法进行测试。结果表明,该方法可以在这些样本上建立有效的深层表征并在其上完成类表象的构建。(2)利用心理学中表象的形成与知觉信息处理过程具有很强相似性的特点,本文将表象系统与视知觉系统建立连接,找到识别活动中各层细胞的活动状态,认为表象的构建来源于识别活动中习得的多个神经元集群的活跃状态,并把其作为表象构建的来源和基础——表象基。通过对识别活动中视皮层各脑区细胞的活动状态进行分别建模,并在其上进行高层次的模式记忆和分析,实现了表象基的提取。(3)结合神经生物学关于视皮层研究的最新成果,将物体识别中的不变性问题引入表象式深层表征的目标范畴确定中。利用腹部视觉通路中细胞的“形状调谐”以及“范畴调谐”的特点,对视皮层细胞的特异性和不变性进行了权衡。(4)利用Bag of words模型构造了Codebook高维空间,利用高维形象几何理论,将图像向量映射成Codebook空间中的样本点,并根据仿生信息学的同源连续性原理,使用BP神经网络分类器找到不同类别目标在Codebook空间中的最佳划分,从而提出了一种复杂场景中特定目标的仿生识别与分类方法;并基于该方法设计了不含隐层和含有一个隐层的BP神经网络仿生分类器,通过实验探讨了影响分类器识别准确率的若干因素及其变化规律,并将本文方法与传统方法得到的实验结果进行对比,证明了论文中提出方法的有效性。(5)在研究了人类视觉系统处理机制的基础上,首先利用方向梯度描述符(HOG)建立了图像的鲁棒表示;然后,根据人类视觉系统的并行处理机制和仿生信息学理论,提出了基于HOG+SVM和HOG+RBPNN的两种人体行为仿生识别与分类方法。利用针对识别与分类方法的评价指标对本文方法进行了评价,最后,与目前常用方法进行了比较,结果表明,在针对静态图像中人体行为的分类与识别效果方面,本文方法对差别较大的行为的识别效果好于常用方法,对相似行为的识别效果还有待于进一步提高。综上所述,本文基于人类视觉系统和高维空间仿生信息学理论,提出的复杂场景中目标的仿生识别与分类算法,可为其他目标识别方法和高维空间仿生信息学的研究提供借鉴。
摘要第4-6页
Abstract第6-8页
第1章 绪论第13-35页
    1.1 研究背景第13-15页
    1.2 高维空间仿生信息学第15-24页
        1.2.1 传统模式识别第15-18页
        1.2.2 仿生模式识别第18-23页
        1.2.3 传统模式识别与仿生模式识别的区别第23-24页
    1.3 图像理解第24-32页
        1.3.1 基本概念第24-28页
        1.3.2 研究内容第28-30页
        1.3.3 发展和应用第30-32页
    1.4 本文的研究内容第32-33页
    1.5 本章小结第33-35页
第2章 高维空间几何和人类视觉感知系统第35-47页
    2.1 引言第35页
    2.2 高维空间几何分析基本概念第35-37页
        2.2.1 高维空间及高维空间的点第35-36页
        2.2.2 高维空间中的基本图形第36-37页
    2.3 高维空间几何覆盖理论第37-39页
        2.3.1 覆盖第37页
        2.3.2 覆盖比第37-38页
        2.3.3 局部顶点覆盖第38页
        2.3.4 覆盖积第38-39页
    2.4 高维空间几何学的分析方法第39页
    2.5 高维空间几何仿生信息学的原理分析第39-40页
    2.6 人类视觉感知系统第40-46页
        2.6.1 视觉感知系统概述第41-42页
        2.6.2 视觉感知的认知基础第42-44页
        2.6.3 基于视觉注意机制的特征提取第44-46页
    2.7 本章小结第46-47页
第3章 基于人脑视皮层识别机制的类表象仿生构建第47-65页
    3.1 引言第47-48页
    3.2 视觉信息处理的脑机制第48-51页
        3.2.1 视觉通路第49页
        3.2.2 视网膜第49-50页
        3.2.3 外膝体第50页
        3.2.4 视皮层第50-51页
    3.3 构建方法及过程第51-59页
        3.3.1 物体识别理论对表象研究的启发第51-54页
        3.3.2 不变性物体识别的生理学依据第54-55页
        3.3.3 特异性的符合性设计第55页
        3.3.4 不变性的符合性设计第55页
        3.3.5 输入集合的确定第55-56页
        3.3.6 功能描述第56-59页
    3.4 实验与分析第59-64页
        3.4.1 算法流程第59页
        3.4.2 实验分析第59-62页
        3.4.3 与 SIFT 算法的比较第62-63页
        3.4.4 与其他常用算法的比较第63-64页
    3.5 本章小结第64-65页
第4章 复杂场景中特定目标的仿生识别第65-85页
    4.1 引言第65-66页
    4.2 Bag of words 模型和 SIFT 描述符第66-73页
        4.2.1 Bag of words 模型第66-70页
        4.2.2 SIFT 描述符第70-73页
    4.3 算法描述及过程第73-77页
        4.3.1 利用 Bag of words 模型构造 Codebook 高维空间第73-74页
        4.3.2 利用仿生信息学原理找到不同目标间的最佳划分第74-75页
        4.3.3 构造训练集和测试集数据第75-76页
        4.3.4 计算网络各层输出第76页
        4.3.5 利用训练集图像寻找不同类别目标之间的边界第76-77页
        4.3.6 识别一幅未知图像中包含的目标第77页
    4.4 影响分类与识别准确率的因素分析第77-79页
        4.4.1 Codebook 中包含的码元数目第77-78页
        4.4.2 隐层节点数目第78页
        4.4.3 允许的网络最大误差第78-79页
    4.5 实验与分析第79-84页
        4.5.1 码元数目对分类性能的影响第79-81页
        4.5.2 隐层节点数目对分类性能的影响第81-83页
        4.5.3 不同分类方法性能的对比第83-84页
    4.6 本章小结第84-85页
第5章 基于视觉的人体行为仿生识别第85-105页
    5.1 引言第85-87页
    5.2 HOG 和 SVM 基本原理第87-91页
        5.2.1 HOG 特征提取第87-90页
        5.2.2 SVM 分类器和径向基概率神经网络(RBPNN)第90-91页
    5.3 基于视觉的人体行为仿生识别与分类方法第91-104页
        5.3.1 性能评价指标第91-95页
        5.3.2 实验分析第95-100页
        5.3.3 与其他识别与分类方法实验结果的比较第100-104页
    5.5 本章小结第104-105页
第6章 全文总结与展望第105-109页
    6.1 本文主要成果第105-108页
        6.1.1 主要结论第105-106页
        6.1.2 主要创新点第106-107页
        6.1.3 经验与不足第107-108页
    6.2 未来展望第108-109页
参考文献第109-125页
作者简介及在攻读博士学位期间发表的学术论文第125-126页
致谢第126页
论文购买
论文编号ABS551902,这篇论文共126页
会员购买按0.30元/页下载,共需支付37.8
不是会员,注册会员
会员更优惠充值送钱
直接购买按0.5元/页下载,共需要支付63
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文

点击收藏 | 在线购卡 | 站内搜索 | 网站地图
版权所有 艾博士论文 Copyright(C) All Rights Reserved
版权申明:本文摘要目录由会员***投稿,艾博士论文编辑,如作者需要删除论文目录请通过QQ告知我们,承诺24小时内删除。
联系方式: QQ:277865656