随着多媒体以及沉浸式媒体技术的发展,人们对音频质量的要求越来越高。与3DTV的视频显示技术研究相比,3D音频再现技术的研究相对滞后。传统的立体声系统以及多通道环绕立体声系统已不适应未来电视的发展,它们不可避免地遇到同样的问题:声源没有准确的方位感,不能反映声源的真实方位;最佳听音位过窄;声像固定。在实际应用中,往往会造成视觉与听觉的不一致,容易产生疲劳感。本论文以音频为研究对象,配合3DTV,以线型扬声器实现3D音频再现为目标,重点研究了3D音频获取方式、空间听觉的特征提取、声束的方向控制以及声像的距离改变。具体工作如下:1、针对3D音频的高阶录制,提出了等距离分布球形麦克风阵列设计方法,将该阵列用于声源空间定位,提出了基于球傅里叶变换的声源定位算法。首先构造代价函数,得到等距离分布的球形麦克风阵列,并用于声场数据采集。根据声学原理,通过球傅里叶变换,将采集到的声场在球谐波域中展开,利用球谐函数的正交性,减化运算,得到幅度密度,再通过球傅里叶反变换,获得声源的空间坐标。2、针对空间听觉,提出了基于非线性流形学习算法-局部线性嵌入的头相关传输函数特征提取以及基于非负矩阵分解-支持向量机的个性化头相关传输函数定制方法。从人脑认识事物的机理出发,利用局部线性嵌入方法对头相关传输函数数据库进行降维,聚类降维后的数据得到特征头相关传输函数,再利用特征头相关传输函数通过插值进行空间听觉的重建。头相关传输函数是与人体参数有关的个性化函数,在分析数据相关性基础上,选择相关性高的人体参数,作为训练的输入,利用非负矩阵分解提取独立分量,作为训练的输出,通过学习得到回归参数,为新的人体参数定制个性化头相关函数。3、针对扬声器重发双耳信号,提出了利用对角加载单位矩阵的方法来减小特征值扩散系数,以提高系统的稳健性。首先分析了串音相消的基本原理,从双扬声器双听点推广到多扬声器多听点的一般情况,给出数学模型,对于串音相矩阵通过对角加载单位矩阵的方法,减少了特征值扩散系数,避免了矩阵的奇异性,提高系统的稳健性。4、针对3D音频再现,提出了利用线型扬声器阵列控制声音的方向以及声像距离的方法。为了与电视系统有机地结合,线型扬声器作为WFS技术中扬声器阵列的一种简化形式,是实现3D音频再现的音频装置。首先由扬声器组成波束单元,分析了波束单元的基本原理,接着详细讨论了扬声器个数与波束的关系、扬声器间距与波束的关系,最后由该波束单元为基础,提出了多波束方向控制的线型扬声器系统,该系统与多通道环绕立体声系统相兼容。对于声像距离的控制,提出一种利用二维FIR滤波器实现声像距离改变的方法。改变声源到不同波前的时间延迟,将该延迟作为二维滤波器的群延迟。考虑到宽带信号,引入具有楔形结构的过渡带,使得扬声器阵列在期望波束宽度内输出稳定波束,使得声像距离听众更近,产生强烈的沉浸感。