首页--工业技术--无线电电子学、电信技术--通信--电声技术和语音信号处理--语音信号处理

空间听觉特征提取与3D音频再现研究

3D音频论文球形麦克风阵列论文空间听觉论文头相关传输函数论文线型扬声器阵列论文

论文详情

随着多媒体以及沉浸式媒体技术的发展,人们对音频质量的要求越来越高。与3DTV的视频显示技术研究相比,3D音频再现技术的研究相对滞后。传统的立体声系统以及多通道环绕立体声系统已不适应未来电视的发展,它们不可避免地遇到同样的问题:声源没有准确的方位感,不能反映声源的真实方位;最佳听音位过窄;声像固定。在实际应用中,往往会造成视觉与听觉的不一致,容易产生疲劳感。本论文以音频为研究对象,配合3DTV,以线型扬声器实现3D音频再现为目标,重点研究了3D音频获取方式、空间听觉的特征提取、声束的方向控制以及声像的距离改变。具体工作如下:1、针对3D音频的高阶录制,提出了等距离分布球形麦克风阵列设计方法,将该阵列用于声源空间定位,提出了基于球傅里叶变换的声源定位算法。首先构造代价函数,得到等距离分布的球形麦克风阵列,并用于声场数据采集。根据声学原理,通过球傅里叶变换,将采集到的声场在球谐波域中展开,利用球谐函数的正交性,减化运算,得到幅度密度,再通过球傅里叶反变换,获得声源的空间坐标。2、针对空间听觉,提出了基于非线性流形学习算法-局部线性嵌入的头相关传输函数特征提取以及基于非负矩阵分解-支持向量机的个性化头相关传输函数定制方法。从人脑认识事物的机理出发,利用局部线性嵌入方法对头相关传输函数数据库进行降维,聚类降维后的数据得到特征头相关传输函数,再利用特征头相关传输函数通过插值进行空间听觉的重建。头相关传输函数是与人体参数有关的个性化函数,在分析数据相关性基础上,选择相关性高的人体参数,作为训练的输入,利用非负矩阵分解提取独立分量,作为训练的输出,通过学习得到回归参数,为新的人体参数定制个性化头相关函数。3、针对扬声器重发双耳信号,提出了利用对角加载单位矩阵的方法来减小特征值扩散系数,以提高系统的稳健性。首先分析了串音相消的基本原理,从双扬声器双听点推广到多扬声器多听点的一般情况,给出数学模型,对于串音相矩阵通过对角加载单位矩阵的方法,减少了特征值扩散系数,避免了矩阵的奇异性,提高系统的稳健性。4、针对3D音频再现,提出了利用线型扬声器阵列控制声音的方向以及声像距离的方法。为了与电视系统有机地结合,线型扬声器作为WFS技术中扬声器阵列的一种简化形式,是实现3D音频再现的音频装置。首先由扬声器组成波束单元,分析了波束单元的基本原理,接着详细讨论了扬声器个数与波束的关系、扬声器间距与波束的关系,最后由该波束单元为基础,提出了多波束方向控制的线型扬声器系统,该系统与多通道环绕立体声系统相兼容。对于声像距离的控制,提出一种利用二维FIR滤波器实现声像距离改变的方法。改变声源到不同波前的时间延迟,将该延迟作为二维滤波器的群延迟。考虑到宽带信号,引入具有楔形结构的过渡带,使得扬声器阵列在期望波束宽度内输出稳定波束,使得声像距离听众更近,产生强烈的沉浸感。

摘要	第6-8页
Abstract	第8-9页
第一章绪论	第12-23页
1.1 课题的研究背景及意义	第12-13页
1.2 国内外研究现状	第13-19页
1.2.1 研究现状	第13-18页
1.2.2 目前存在着的问题	第18-19页
1.3 论文的主要工作及内容编排	第19-23页
第二章 3D 音频概述	第23-36页
2.1 引言	第23-24页
2.2 声源的空间属性	第24-26页
2.2.1 方向定位	第25页
2.2.2 距离定位	第25-26页
2.3 头相关传输函数	第26-32页
2.3.1 头相关传输函数数据库	第27-29页
2.3.2 头相关传输函数的方位信息	第29-32页
2.4 声场合成	第32-35页
2.4.1 Kirchoff-Helmholtz 积分	第33页
2.4.2 声场合成	第33-35页
2.5 小结	第35-36页
第三章基于球傅里叶变换的声源定位	第36-51页
3.1 引言	第36-37页
3.2 波动方程	第37-38页
3.3 基于球傅里叶变换的声场分解	第38-43页
3.3.1 球傅里叶变换	第38-41页
3.3.2 球谐波正交性	第41-43页
3.4 球麦克风阵列的声源定位算法	第43-49页
3.4.1 球等距分布	第43-46页
3.4.2 声源定位算法	第46-47页
3.4.3 仿真结果	第47-49页
3.5 小结	第49-51页
第四章空间听觉特征提取	第51-76页
4.1 引言	第51-52页
4.2 HRTF 数据特征	第52-57页
4.2.1 主分量分析	第52-55页
4.2.2 数据间相关性分析	第55-57页
4.3 基于流形学习的特征提取	第57-67页
4.3.1 感知的流形	第57-58页
4.3.2 局部线性嵌入	第58-60页
4.3.3 聚类算法与插值算法	第60-62页
4.3.4 仿真结果	第62-67页
4.4 个性化HRTF 定制	第67-74页
4.4.1 人体参数的选择	第68-70页
4.4.2 个人HRTF 定制	第70-73页
4.4.3 仿真结果	第73-74页
4.5 小结	第74-76页
第五章线型扬声器阵列 3D 音频再现	第76-107页
5.1 引言	第76页
5.2 双耳信号的扬声器重发	第76-87页
5.2.1 串音干扰消除	第77-79页
5.2.2 头部转动的影响	第79-80页
5.2.3 稳健的串音消除方法	第80-87页
5.3 多波束声束方向控制	第87-94页
5.3.1 扬声器波束单元	第87-89页
5.3.2 仿真结果	第89-93页
5.3.3 系统设计	第93-94页
5.4 声像距离控制	第94-106页
5.4.1 波前半径改变	第94-96页
5.4.2 幅频特性与相频特性	第96-100页
5.4.3 二维 FIR 滤波器实现	第100-101页
5.4.4 信号重建与声像形成	第101-102页
5.4.5 仿真结果	第102-106页
5.5 小结	第106-107页
第六章总结与展望	第107-110页
6.1 主要工作总结	第107-108页
6.2 下一步研究展望	第108-110页
参考文献	第110-120页
攻读博士学位期间成果	第120-121页
致谢	第121页

论文购买

论文编号ABS541585，这篇论文共121页

会员购买按0.30元/页下载，共需支付36.3。

会员购买

不是会员，注册会员！
会员更优惠充值送钱！

直接购买按0.5元/页下载，共需要支付60.5。

直接购买

只需这篇论文，无需注册！
直接网上支付，方便快捷！