MDCT属于调制重叠变换[113][114](Modulated Lapped Transform,MLT)相邻变换块有50%的重叠;各个变换基是低通FIR滤波器系数(也称窗函数)的余弦调制,并且同一变换块以及相邻变换块的变换基间两两正交的。50%的重叠使得相邻的变换块在时间上具有淡入淡出的特性,从而避免了一般变换的块效应[115];变换基的正交性使得块间重叠带来的时域混叠在MDCT逆变换时得到消除,即时域去混叠[111][116]。另外,MDCT也是临界采样的子带滤波器组,其频域谱线数保持了时域样点数的一致。当用于音频压缩时,这三条特性意味着:没有块切换噪音,信号可完全可重建,且没有变换域数据量的增加。
上述MDCT的独特性质在给音频压缩带来便利的同时,也造成了MDCT域信号分析的困难。此外,心理声学模型中的绝对听觉门限(Absolute Hearing Threshold,AHT)和遮蔽门限[2][64][117](Masking Threshold)均是以DFT域的数值为分析对象,使得音频压缩中常用的MDCT域的量化噪音与其在DFT域产生量化噪音不是线性的对应关系,从而降低时频变换与心理声学模型的匹配度。(www.xing528.com)
因此,1999年H.Malvar提出了调制复重叠变换[118](Modulated Complex Lapped Transform,MCLT):实部是MDCT,虚部是修正离散正弦变换MDST。对MDCT和MDST使用同一个低通FIR滤波器原型,赋予了频谱信号相位信息,但MCLT仍然不具有类似DFT的延时与相位的线性对应关系,无法解决空间参数的准确表示。基于上述考虑,本小节从双耳线索的形成机理出发,分析MDCT频谱对双耳线索的影响,提出了一种基于共轭窗函数的MDCT频谱复数化扩展方法(Complex Extension of MDCT based Conjugate Window Functions,CEM-CWF)。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。