下混/上混模块的作用和应用

更新时间：2025-01-08 工作计划版权反馈

【摘要】：当前空间音频编码技术中有两种下混模式:2至1下混模式和3至2的下混模式。MPEG Surround中的树状分析下混结构正是由OTT和TTT这两种基本下混模式构成［5］，如图5-7所示。

在空间音频编码系统中，如图5-3所示，下混是指对经过声源分离模块后的输出信号，采用一定的运算方法，也就是通过下混矩阵，获得记录各个独立声源信息的单声道/双声道信号;上混是指将经过通用解码模块后的输出信号，通过一对二或二对三的操作，也就是通过上混矩阵，获得两路/多路信号。

1.编码端的下混操作模块

多数情况下立体声或多声道信号是通过简单的叠加操作得到下混声道信号。对下混后的信号可使用任意传统的音频编码方法，通常可认为下混后的这部分信号是可以达到几乎无损(透明)的编解码。

当前空间音频编码技术中有两种下混模式:2至1下混模式(One to Two，OTT)和3至2的下混模式(Two to Three，TTT)。其中OTT是输入的两个声道下混矩阵输出一个声道，TTT是输入的三个声道信号通过下混矩阵输出两个声道。

MPEG Surround中的树状分析下混结构正是由OTT和TTT这两种基本下混模式构成［5］，如图5-7所示。这种树状分析下混结构具有较强的声道可扩展性，可方便地进行5.1、7.1甚至是更多声道的编码，通过该方法可实现多声道信号与当前立体声回放设备的自然融合。

pagenumber_ebook=136,pagenumber_book=126

图5-7　 MPEG Surround的树状分析下混结构(www.xing528.com)

下混模式OTT中采用的下混矩阵，最常用的是1990年J.D.John提出的和差立体声技术M/S［38］，如下式所示。M/S技术是将输入的立体声信号变换为和差声道，其中和声道M作为空间音频编码中的下混声道。

pagenumber_ebook=137,pagenumber_book=127

值得注意的是，对于原始信号中有大量局部同相或反相信号的情况，M/S方法得到的下混声道信号将被不成比例的放大或削弱，导致信号不可恢复［121］。解决这个问题一个直接的方法是以子带单位进行增益控制，使下混声道子带能量等于原始信号各声道在对应子带上能量之和［78］。此外，通过相位调整的方法也可避免这一问题。

2.解码端的上混操作模块

相对于编码端的下混操作模块，在空间音频编码技术中，解码端是需要通过上混操作模块得到多路信号，作为空间参数合成的基础声道信号。上混操作相对较复杂，是构成空间音频解码端复杂度高的重要因素之一。

当前通常采用直接单声道复制或使用去相关滤波器等方法完成上混操作。例如，在BCC模型中采用的随机序列法，它在频谱中加入一个伪随机序列，通过调整这个序列的方差，使得声道间具有给定的相关度。与BCC不同，MPEG Surround采用的是基于混响滤波器的去相关技术。这项技术是以混响理论为基础的，相对于BCC中的随机序列法，无论在物理意义还是实际效果上都有了质的飞跃。混响滤波器用来模拟厅堂各个反射面反射声波并叠加的音响效果。混响滤波器的输出和输入有相同的听觉内容，只是更富于空间感，但两者的相关度上几乎为0。实际上，现场采集的音频信号间相关度＜1的重要原因就是录音场所的混响。因此采用混响滤波器去相关，相对随机序列法，更接近物理实际。在效果上，这种方法也有了质的提升。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈

工作思路

策划书

留守儿童

关工委

内部审计

爱国卫生

业务员

信息技术

教研员

心理教育

居委会

社区学校

公司安全

部门月度

区安全

公司工会

乡镇基层

劳动保障

经理年度

内科年度

教学个人

前台个人

个人月度

配班个人

下混/上混模块的作用和应用

相关推荐

下混/上混模块的作用和应用

有关基于双耳线索的移动音频编码研究的文章

相关推荐