复杂场景中目标识别与分类的仿生原理和方法
高维空间仿生信息学论文 图像理解论文 目标识别与分类论文 SVM分类器论文 人体行为识别论文
论文详情
图像理解是以图像为研究对象,以人类知识为核心,主要研究图像中有什么目标、目标之间的相互关系、图像是什么场景以及如何应用场景的一门科学。其主要研究方向有场景中目标的分类与识别、场景描述与理解两个方面。其中,目标识别是为了对场景进行更好的解释,是场景描述与理解的基础,具有主动性。场景描述与理解为目标识别提供先验信息,可以指导目标识别。从本质上说,图像理解源于计算机视觉,但也融合了人工智能和认知学领域的知识信息,是与计算机视觉、人工智能和认知学相互关联又相互独立的研究领域。目标识别作为图像理解的基础,已应用于身份确定、智能交通管理、机动车辆检测等领域。目标识别的任务是使计算机具有对视觉图像进行复杂背景下检测、识别目标并进行分类的能力。但目前用于目标识别的模板匹配、边缘检测和统计等方法都缺乏生物视觉系统的智能性。自20世纪90年代开始,王守觉院士研究分析了人类认识事物的过程,总结出了同源样本的连续性规律,并称之为同源连续性原理,然后将此原理应用到模式识别中,提出了仿生模式识别方法,并由此形成了高维空间仿生信息学理论,该理论的提出为如何利用计算机解决形象思维问题开辟了一个新途径。本文从研究生物视觉系统的工作机理出发,结合王守觉院士关于高维空间仿生信息学的相关理论,构建相应的计算机模型,研究了图像理解中的目标识别与分类问题,针对不同场景提出了多种目标分类与识别方法。实验结果表明,本文提出的复杂场景中目标的特征提取模型以及在此基础上提出的仿生识别与分类方法有效可行。本文的主要工作总结如下。(1)应用神经生物学知识,对物体识别中涉及的各个脑区分别建模,提出了一种基于视皮层不变性识别机制的类表象仿生构建方法;并利用真实图像组成的训练集和测试集对模型和算法进行测试。结果表明,该方法可以在这些样本上建立有效的深层表征并在其上完成类表象的构建。(2)利用心理学中表象的形成与知觉信息处理过程具有很强相似性的特点,本文将表象系统与视知觉系统建立连接,找到识别活动中各层细胞的活动状态,认为表象的构建来源于识别活动中习得的多个神经元集群的活跃状态,并把其作为表象构建的来源和基础——表象基。通过对识别活动中视皮层各脑区细胞的活动状态进行分别建模,并在其上进行高层次的模式记忆和分析,实现了表象基的提取。(3)结合神经生物学关于视皮层研究的最新成果,将物体识别中的不变性问题引入表象式深层表征的目标范畴确定中。利用腹部视觉通路中细胞的“形状调谐”以及“范畴调谐”的特点,对视皮层细胞的特异性和不变性进行了权衡。(4)利用Bag of words模型构造了Codebook高维空间,利用高维形象几何理论,将图像向量映射成Codebook空间中的样本点,并根据仿生信息学的同源连续性原理,使用BP神经网络分类器找到不同类别目标在Codebook空间中的最佳划分,从而提出了一种复杂场景中特定目标的仿生识别与分类方法;并基于该方法设计了不含隐层和含有一个隐层的BP神经网络仿生分类器,通过实验探讨了影响分类器识别准确率的若干因素及其变化规律,并将本文方法与传统方法得到的实验结果进行对比,证明了论文中提出方法的有效性。(5)在研究了人类视觉系统处理机制的基础上,首先利用方向梯度描述符(HOG)建立了图像的鲁棒表示;然后,根据人类视觉系统的并行处理机制和仿生信息学理论,提出了基于HOG+SVM和HOG+RBPNN的两种人体行为仿生识别与分类方法。利用针对识别与分类方法的评价指标对本文方法进行了评价,最后,与目前常用方法进行了比较,结果表明,在针对静态图像中人体行为的分类与识别效果方面,本文方法对差别较大的行为的识别效果好于常用方法,对相似行为的识别效果还有待于进一步提高。综上所述,本文基于人类视觉系统和高维空间仿生信息学理论,提出的复杂场景中目标的仿生识别与分类算法,可为其他目标识别方法和高维空间仿生信息学的研究提供借鉴。
摘要 | 第4-6页 |
Abstract | 第6-8页 |
第1章 绪论 | 第13-35页 |
1.1 研究背景 | 第13-15页 |
1.2 高维空间仿生信息学 | 第15-24页 |
1.2.1 传统模式识别 | 第15-18页 |
1.2.2 仿生模式识别 | 第18-23页 |
1.2.3 传统模式识别与仿生模式识别的区别 | 第23-24页 |
1.3 图像理解 | 第24-32页 |
1.3.1 基本概念 | 第24-28页 |
1.3.2 研究内容 | 第28-30页 |
1.3.3 发展和应用 | 第30-32页 |
1.4 本文的研究内容 | 第32-33页 |
1.5 本章小结 | 第33-35页 |
第2章 高维空间几何和人类视觉感知系统 | 第35-47页 |
2.1 引言 | 第35页 |
2.2 高维空间几何分析基本概念 | 第35-37页 |
2.2.1 高维空间及高维空间的点 | 第35-36页 |
2.2.2 高维空间中的基本图形 | 第36-37页 |
2.3 高维空间几何覆盖理论 | 第37-39页 |
2.3.1 覆盖 | 第37页 |
2.3.2 覆盖比 | 第37-38页 |
2.3.3 局部顶点覆盖 | 第38页 |
2.3.4 覆盖积 | 第38-39页 |
2.4 高维空间几何学的分析方法 | 第39页 |
2.5 高维空间几何仿生信息学的原理分析 | 第39-40页 |
2.6 人类视觉感知系统 | 第40-46页 |
2.6.1 视觉感知系统概述 | 第41-42页 |
2.6.2 视觉感知的认知基础 | 第42-44页 |
2.6.3 基于视觉注意机制的特征提取 | 第44-46页 |
2.7 本章小结 | 第46-47页 |
第3章 基于人脑视皮层识别机制的类表象仿生构建 | 第47-65页 |
3.1 引言 | 第47-48页 |
3.2 视觉信息处理的脑机制 | 第48-51页 |
3.2.1 视觉通路 | 第49页 |
3.2.2 视网膜 | 第49-50页 |
3.2.3 外膝体 | 第50页 |
3.2.4 视皮层 | 第50-51页 |
3.3 构建方法及过程 | 第51-59页 |
3.3.1 物体识别理论对表象研究的启发 | 第51-54页 |
3.3.2 不变性物体识别的生理学依据 | 第54-55页 |
3.3.3 特异性的符合性设计 | 第55页 |
3.3.4 不变性的符合性设计 | 第55页 |
3.3.5 输入集合的确定 | 第55-56页 |
3.3.6 功能描述 | 第56-59页 |
3.4 实验与分析 | 第59-64页 |
3.4.1 算法流程 | 第59页 |
3.4.2 实验分析 | 第59-62页 |
3.4.3 与 SIFT 算法的比较 | 第62-63页 |
3.4.4 与其他常用算法的比较 | 第63-64页 |
3.5 本章小结 | 第64-65页 |
第4章 复杂场景中特定目标的仿生识别 | 第65-85页 |
4.1 引言 | 第65-66页 |
4.2 Bag of words 模型和 SIFT 描述符 | 第66-73页 |
4.2.1 Bag of words 模型 | 第66-70页 |
4.2.2 SIFT 描述符 | 第70-73页 |
4.3 算法描述及过程 | 第73-77页 |
4.3.1 利用 Bag of words 模型构造 Codebook 高维空间 | 第73-74页 |
4.3.2 利用仿生信息学原理找到不同目标间的最佳划分 | 第74-75页 |
4.3.3 构造训练集和测试集数据 | 第75-76页 |
4.3.4 计算网络各层输出 | 第76页 |
4.3.5 利用训练集图像寻找不同类别目标之间的边界 | 第76-77页 |
4.3.6 识别一幅未知图像中包含的目标 | 第77页 |
4.4 影响分类与识别准确率的因素分析 | 第77-79页 |
4.4.1 Codebook 中包含的码元数目 | 第77-78页 |
4.4.2 隐层节点数目 | 第78页 |
4.4.3 允许的网络最大误差 | 第78-79页 |
4.5 实验与分析 | 第79-84页 |
4.5.1 码元数目对分类性能的影响 | 第79-81页 |
4.5.2 隐层节点数目对分类性能的影响 | 第81-83页 |
4.5.3 不同分类方法性能的对比 | 第83-84页 |
4.6 本章小结 | 第84-85页 |
第5章 基于视觉的人体行为仿生识别 | 第85-105页 |
5.1 引言 | 第85-87页 |
5.2 HOG 和 SVM 基本原理 | 第87-91页 |
5.2.1 HOG 特征提取 | 第87-90页 |
5.2.2 SVM 分类器和径向基概率神经网络(RBPNN) | 第90-91页 |
5.3 基于视觉的人体行为仿生识别与分类方法 | 第91-104页 |
5.3.1 性能评价指标 | 第91-95页 |
5.3.2 实验分析 | 第95-100页 |
5.3.3 与其他识别与分类方法实验结果的比较 | 第100-104页 |
5.5 本章小结 | 第104-105页 |
第6章 全文总结与展望 | 第105-109页 |
6.1 本文主要成果 | 第105-108页 |
6.1.1 主要结论 | 第105-106页 |
6.1.2 主要创新点 | 第106-107页 |
6.1.3 经验与不足 | 第107-108页 |
6.2 未来展望 | 第108-109页 |
参考文献 | 第109-125页 |
作者简介及在攻读博士学位期间发表的学术论文 | 第125-126页 |
致谢 | 第126页 |
论文购买
论文编号
ABS551902,这篇论文共126页
会员购买按0.30元/页下载,共需支付
37.8。
不是会员,
注册会员!
会员更优惠
充值送钱!
直接购买按0.5元/页下载,共需要支付
63。
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文