首页--工业技术--自动化技术、计算机技术--计算技术、计算机技术--计算机的应用--信息处理（信息加工）--模式识别与装置

基于卷积神经网络的场景理解方法研究

卷积神经网络论文场景理解论文交通标志检测论文

论文详情

场景理解是计算机视觉的一个重要研究问题,在机器人导航、自动驾驶、环境检测、基于内容的图像搜索等多个应用场景中,具有广泛的应用价值。在理论方面,场景理解研究如何让机器能够像人一样理解图像的语义信息,是早期视觉研究提出的几个重要任务之一,至今仍然没有得到较好的解决。场景理解包括场景标注、物体检测及识别、以及最终对于场景本身的语义理解等。场景理解的一个难点是如何获得图像对于平移、旋转、尺度变化具有一定不变性的语义特征。基于视觉认知机制提出的卷积神经网络能够在有监督模式下,基于大量样本学习到具有一定鲁棒性的特征,近年来在计算机视觉、语音识别等多个领域获得了突出效果。然而作为特征提取工具,卷积神经网络的模型选择往往花费大量时间。虽然卷积神经具备局部平移不变性,其对于尺度变化还不具备较好的鲁棒性,学习到的中高层特征也不能得到较好的语义解释。本文利用卷积神经网络作为特征提取工具,通过研究卷积神经网络具有多尺度信息的模型,初步解决场景理解中交通标志检测和场景标注任务。在具体任务中,本文对卷积神经网络的模型选择和参数选择进行了研究。实时的目标检测需要从图像中迅速获得包围框。而卷积神经网络对包围框位置和尺度准确性的要求比较高。在交通标志检测问题中,本文首先使用SVM将RGB图像转化为灰度图像,再使用固定卷积核的卷积神经网络获得多个尺度下的包围框,并使用多阶段的卷积神经网络对包围框进行识别。在德国交通标志检测数据集上,我们在指示类标志中获得了第二名,而在警告类标志中获得了第三名。在场景标注中,本文使用多尺度卷积神经网络对场景进行基于像素的标注。使用多尺度卷积神经网络充分利用了不同尺度下的语义信息。在卷积神经网络标注后,本文使用全连接条件随机场消除部分不准确的标注。我们在斯坦福背景数据集上获得了79%的平均像素准确率,处理速度为平均每张图片2秒的时间。

摘要	第3-4页
Abstract	第4-5页
第1章序言	第8-21页
1.1 卷积神经网络	第9-13页
1.1.1 CNN结构	第9-10页
1.1.2 CNN目标函数及优化	第10-12页
1.1.3 CNN相关研究	第12页
1.1.4 CNN可视化表达	第12-13页
1.2 条件随机场	第13-15页
1.2.1 全连接条件随机场	第14-15页
1.3 场景理解	第15-19页
1.3.1 交通标志检测	第16-17页
1.3.2 场景标注	第17-19页
1.4 本文贡献	第19-20页
1.5 论文结构	第20-21页
第2章交通标志检测	第21-30页
2.1 问题描述	第21页
2.2 算法介绍	第21-25页
2.2.1 颜色转化	第22页
2.2.2 CNN模型	第22-23页
2.2.3 固定卷积核的CNN	第23-25页
2.2.4 可变卷积核的CNN	第25页
2.2.5 后处理	第25页
2.3 实验	第25-29页
2.3.1 数据预处理	第26页
2.3.2 实验分析	第26页
2.3.3 准确性	第26-27页
2.3.4 识别速度	第27-29页
2.4 本章总结	第29-30页
第3章场景标注	第30-46页
3.1 问题描述	第30页
3.2 算法介绍	第30-35页
3.2.1 多尺度卷积神经网络	第30-34页
3.2.2 全连接条件随机场	第34-35页
3.3 实验	第35-42页
3.3.1 实验结果	第35页
3.3.2 数据集	第35-37页
3.3.3 卷积神经网络的参数选择	第37-38页
3.3.4 卷积神经网络的模型选择	第38-40页
3.3.5 条件随机场	第40-41页
3.3.6 结果分析	第41-42页
3.4 本章总结	第42-46页
第4章总结及展望	第46-48页
4.1 论文工作总结	第46-47页
4.2 未来工作展望	第47-48页
参考文献	第48-51页
致谢	第51-53页
个人简历、在学期间发表的学术论文与研究成果	第53页

论文购买

论文编号ABS3234332，这篇论文共53页

会员购买按0.30元/页下载，共需支付15.9。

会员购买

不是会员，注册会员！
会员更优惠充值送钱！

直接购买按0.5元/页下载，共需要支付26.5。

直接购买

只需这篇论文，无需注册！
直接网上支付，方便快捷！