首页 理论教育 CMCLT域的双耳线索表示优化

CMCLT域的双耳线索表示优化

时间:2023-06-18 理论教育 版权反馈
【摘要】:图4-13空间参数变换域合成获得当前第i帧的CMCLT谱线。用式对CMCLT谱线进行滤波,得到混响去相关信号,并通过增益调整获得能量守恒的去相关信号。

CMCLT域的双耳线索表示优化

为获得与双耳线索时域表达式(4.18)等价的变换域双耳线索表达式,本节在提出C2S快速转换解决4.2节中引入MDST变换带来复杂度增加的问题,以上分析论证了在CMCLT域能保持信号能量以及时域偏移在CMCLT域形成线性的附加相位。因此,本节考察以CMCLT作为变换域的双耳线索表达式。

1.编码端双耳线索的提取

在实际空间音频编码系统中,输入的立体声信号通常都包含多个听觉对象。这些听觉对象分布在不同的时频区域内,一般通过子带滤波器组进行滤波分离,并以每个子带输出的信号为基本处理单元进行双耳线索的提取。特别的,如果子带滤波以时频变换的形式出现,那么提取双耳线索的基本单元就是一段连续的频谱。在离散信号处理中,用谱线求和替代连续域的积分,因此实际应用中是针在各个基本提取单元范围内对谱线求和,得到多组双耳线索,以反映实际立体声信号包含多个听觉对象的特征。

(1)双耳强度差ILD。

与时域表达式(4.18)中获得双耳线索ILD一样,假设干扰信号能量远小于信号自身的能量,即。由于在CMCLT域信号能量和能够保持与时域信号能量相等,结合公式(4.13)和(4.53),根据ILD的定义,有

(2)双耳时间差ITD和耳间相关度IC。

ITD记录的是具有最大互相关的时间偏移τ,IC则记录了此时的归一化相关度。从公式(4.15)可以看出,左右耳入声信号的归一化相关度函数Cxl,xr(τ)在τ=Δt处取得最大值IC。通常情况下,假定左右声道干扰信号不相关,即Rnl,nr(m)≡0。因此,可以通过计算Rxl,xr(τ)取得最大值的时间来确定ITD,进而确定IC。然而,双耳线索提取的基本单元xl和xr是以一段连续谱线的形式出现,于是问题归结到寻找在CMCLT域计算自相关函数Rxl,xr(m)的方法。由自相关定义公式,有

式中:Xq(k)和Yp(k)分别为加共轭窗的MDCT和MDST谱线,¯Z(k)为CMCLT谱线,是延时d后CMCLT谱线。将计算公式(4.72)代入上式,有

由于编码系统中我们能够获得CMCLT谱线(k)和(k)。于是通过遍历有限个可能的m值,比较Rxl,xr(m)的大小是可以提取立体声信号的ITD,即

然而,这种遍历的做法太直接,复杂度是非常高的。于是,将公式(4.105)代入公式(4.14),其中假定Rnl,nr(m)≡0,有

式中:Q(k)是无干扰信号q(n)的CMCLT谱线。令上式(4.107)的m=0,比较式(4.105)和(4.107)有

于是,

也就是说,可以通过计算相频曲线的斜率求得时间差Δt,即通过左右信号CMCLT谱线¯Zl(k)和¯Zr(k)相位差的群延时,有

结合式(4.106)、(4.107)以及双耳线索IC定义(4.16),有

综上所述,在CMCLT变换域中,我们获取了与时域表达式(4.18)等价的双耳线索ILD、ITD和IC表达式。即实际应用中采用的双耳线索ILD、ITD和IC的计算式分别对应于式(4.103)、式(4.110)和式(4.111)。

2.解码端双耳线索的合成

在参数立体声中,解码器需要根据单声道解码信号和空间参数信息重建出立体声的左右声道,如图4-13所示。对本文基于CMCLT域的空间音频解码器来说,首先要根据单声道解码的MDCT谱线构建出立体声左右声道的CMCLT谱线,然后对上混操作输出的两路去相关信号进行空间线索调整,即重建与原声道有相同的时间差ITD、相关度IC和强度差ILD的立体声信号,最后反变换得到时域输出。(www.xing528.com)

图4-13 空间参数变换域合成

(1)获得当前第i帧的CMCLT谱线(k)。

4.2.3小节中将CMCLT构造为实部是加窗的MDCT谱线(k),虚部是加窗的MDST谱线(k)的复变换。解码端输入的下混声道信号,当前只有MDCT域的谱线,因此首先需要根据MDCT谱线,构建出CMCLT谱线的虚部,即MDST谱线。

从MDCT谱线获得MDST谱线有两种基本思路:第一,利用MDCT重叠相加技术,进行IMDCT变换重建原时域信号,接着通过MDST变换构建CMCLT谱线;第二,为降低IMDCT和MDST变换增加的系统复杂度,采用4.3.1小节和4.3.2小节介绍的方法,利用MDCT-MDST转换关系,从MDCT谱线中快速获得MDST谱线。

(2)采用混响滤波器获得去相关信号(k)。

如4.2.2小节所述,混响信号是噪音的一个主要来源,可采用当前空间音频编码系统中上混模块采用的方法。其中,混响滤波的方法相对于BCC模型中插入随机序列的方法更接近于实际听音场景。

利用下面的混响滤波器产生混响信号:

式中:hd(n)是滤波器的冲击响应,Ns是冲击响应的长度,n=0,1,…,Ns-1。一般取Ns=640。用式(4.112)对CMCLT谱线进行滤波,得到混响去相关信号,并通过增益调整获得能量守恒的去相关信号(k)。

(3)合成具有给定相关度IC,强度差ILD和时间差ITD的两路信号。

首先是相关度IC的调整。为使左右声道信号具有的相关度为IC,令

于是

可以验证,利用上式的调整(k)和(k)的相关度恰好为IC。

接着是强度差ILD的调整。ILD的合成不仅要保证左右声道的能量比为ILD,还需要保证信号的总能量与原始立体声信号的总能量一致,即

式中:g0和g1是能量调整系数。于是

最后是时间差ITD的调整。时域的延时在CMCLT域产生线性的相位延时,ITD的合成基于(4.72)式的CMCLT延时相位关系,有

式中:d0是延时ITD对应的采样样点,满足d0=fs·ITD。

(4)对(k)和(k)进行综合滤波,重建时域信号。

通过逆CMCLT变换或者将实部和虚部拆分,分别进行IMDCT变换,然后加窗重叠相加,得到时域第i帧左右声道的重建信号

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈