空间听觉特征提取与3D音频再现研究

3D音频论文 球形麦克风阵列论文 空间听觉论文 头相关传输函数论文 线型扬声器阵列论文
论文详情
随着多媒体以及沉浸式媒体技术的发展,人们对音频质量的要求越来越高。与3DTV的视频显示技术研究相比,3D音频再现技术的研究相对滞后。传统的立体声系统以及多通道环绕立体声系统已不适应未来电视的发展,它们不可避免地遇到同样的问题:声源没有准确的方位感,不能反映声源的真实方位;最佳听音位过窄;声像固定。在实际应用中,往往会造成视觉与听觉的不一致,容易产生疲劳感。本论文以音频为研究对象,配合3DTV,以线型扬声器实现3D音频再现为目标,重点研究了3D音频获取方式、空间听觉的特征提取、声束的方向控制以及声像的距离改变。具体工作如下:1、针对3D音频的高阶录制,提出了等距离分布球形麦克风阵列设计方法,将该阵列用于声源空间定位,提出了基于球傅里叶变换的声源定位算法。首先构造代价函数,得到等距离分布的球形麦克风阵列,并用于声场数据采集。根据声学原理,通过球傅里叶变换,将采集到的声场在球谐波域中展开,利用球谐函数的正交性,减化运算,得到幅度密度,再通过球傅里叶反变换,获得声源的空间坐标。2、针对空间听觉,提出了基于非线性流形学习算法-局部线性嵌入的头相关传输函数特征提取以及基于非负矩阵分解-支持向量机的个性化头相关传输函数定制方法。从人脑认识事物的机理出发,利用局部线性嵌入方法对头相关传输函数数据库进行降维,聚类降维后的数据得到特征头相关传输函数,再利用特征头相关传输函数通过插值进行空间听觉的重建。头相关传输函数是与人体参数有关的个性化函数,在分析数据相关性基础上,选择相关性高的人体参数,作为训练的输入,利用非负矩阵分解提取独立分量,作为训练的输出,通过学习得到回归参数,为新的人体参数定制个性化头相关函数。3、针对扬声器重发双耳信号,提出了利用对角加载单位矩阵的方法来减小特征值扩散系数,以提高系统的稳健性。首先分析了串音相消的基本原理,从双扬声器双听点推广到多扬声器多听点的一般情况,给出数学模型,对于串音相矩阵通过对角加载单位矩阵的方法,减少了特征值扩散系数,避免了矩阵的奇异性,提高系统的稳健性。4、针对3D音频再现,提出了利用线型扬声器阵列控制声音的方向以及声像距离的方法。为了与电视系统有机地结合,线型扬声器作为WFS技术中扬声器阵列的一种简化形式,是实现3D音频再现的音频装置。首先由扬声器组成波束单元,分析了波束单元的基本原理,接着详细讨论了扬声器个数与波束的关系、扬声器间距与波束的关系,最后由该波束单元为基础,提出了多波束方向控制的线型扬声器系统,该系统与多通道环绕立体声系统相兼容。对于声像距离的控制,提出一种利用二维FIR滤波器实现声像距离改变的方法。改变声源到不同波前的时间延迟,将该延迟作为二维滤波器的群延迟。考虑到宽带信号,引入具有楔形结构的过渡带,使得扬声器阵列在期望波束宽度内输出稳定波束,使得声像距离听众更近,产生强烈的沉浸感。
摘要第6-8页
Abstract第8-9页
第一章 绪论第12-23页
    1.1 课题的研究背景及意义第12-13页
    1.2 国内外研究现状第13-19页
        1.2.1 研究现状第13-18页
        1.2.2 目前存在着的问题第18-19页
    1.3 论文的主要工作及内容编排第19-23页
第二章 3D 音频概述第23-36页
    2.1 引言第23-24页
    2.2 声源的空间属性第24-26页
        2.2.1 方向定位第25页
        2.2.2 距离定位第25-26页
    2.3 头相关传输函数第26-32页
        2.3.1 头相关传输函数数据库第27-29页
        2.3.2 头相关传输函数的方位信息第29-32页
    2.4 声场合成第32-35页
        2.4.1 Kirchoff-Helmholtz 积分第33页
        2.4.2 声场合成第33-35页
    2.5 小结第35-36页
第三章 基于球傅里叶变换的声源定位第36-51页
    3.1 引言第36-37页
    3.2 波动方程第37-38页
    3.3 基于球傅里叶变换的声场分解第38-43页
        3.3.1 球傅里叶变换第38-41页
        3.3.2 球谐波正交性第41-43页
    3.4 球麦克风阵列的声源定位算法第43-49页
        3.4.1 球等距分布第43-46页
        3.4.2 声源定位算法第46-47页
        3.4.3 仿真结果第47-49页
    3.5 小结第49-51页
第四章 空间听觉特征提取第51-76页
    4.1 引言第51-52页
    4.2 HRTF 数据特征第52-57页
        4.2.1 主分量分析第52-55页
        4.2.2 数据间相关性分析第55-57页
    4.3 基于流形学习的特征提取第57-67页
        4.3.1 感知的流形第57-58页
        4.3.2 局部线性嵌入第58-60页
        4.3.3 聚类算法与插值算法第60-62页
        4.3.4 仿真结果第62-67页
    4.4 个性化HRTF 定制第67-74页
        4.4.1 人体参数的选择第68-70页
        4.4.2 个人HRTF 定制第70-73页
        4.4.3 仿真结果第73-74页
    4.5 小结第74-76页
第五章 线型扬声器阵列 3D 音频再现第76-107页
    5.1 引言第76页
    5.2 双耳信号的扬声器重发第76-87页
        5.2.1 串音干扰消除第77-79页
        5.2.2 头部转动的影响第79-80页
        5.2.3 稳健的串音消除方法第80-87页
    5.3 多波束声束方向控制第87-94页
        5.3.1 扬声器波束单元第87-89页
        5.3.2 仿真结果第89-93页
        5.3.3 系统设计第93-94页
    5.4 声像距离控制第94-106页
        5.4.1 波前半径改变第94-96页
        5.4.2 幅频特性与相频特性第96-100页
        5.4.3 二维 FIR 滤波器实现第100-101页
        5.4.4 信号重建与声像形成第101-102页
        5.4.5 仿真结果第102-106页
    5.5 小结第106-107页
第六章 总结与展望第107-110页
    6.1 主要工作总结第107-108页
    6.2 下一步研究展望第108-110页
参考文献第110-120页
攻读博士学位期间成果第120-121页
致谢第121页
论文购买
论文编号ABS541585,这篇论文共121页
会员购买按0.30元/页下载,共需支付36.3
不是会员,注册会员
会员更优惠充值送钱
直接购买按0.5元/页下载,共需要支付60.5
只需这篇论文,无需注册!
直接网上支付,方便快捷!
相关论文

点击收藏 | 在线购卡 | 站内搜索 | 网站地图
版权所有 艾博士论文 Copyright(C) All Rights Reserved
版权申明:本文摘要目录由会员***投稿,艾博士论文编辑,如作者需要删除论文目录请通过QQ告知我们,承诺24小时内删除。
联系方式: QQ:277865656