如图5-3所示的空间音频编码系统基本结构中,通用编码作为一个独立的模块,输入的是下混后的单声道信号,输出的是单声道码流,内部不需要任何与空间参数编码有关的修改。因此在通用编码器选取上有很大的选择余地,可以是感知编码器MP3和AAC,甚至是参数编码器。
这种普适性为空间参数编码技术的研究提供了便利,因为可以独立地对空间参数编码的关键模块进行改进,无需考虑对通用编码器的影响。但是这种基本结构的缺点也是非常突出的:
(1)空间参数的提取需要独立的时频变换模块。
一方面,编解码总计8次的时频变换意味着复杂度的增加;另一方面,对空间参数的提取操作至少需要1帧的附加延时。
(2)时频划分和参数码率难以两全。
在采用时频划分替代声源分离的方法中,因受到系统结构的约束,当前的编码系统要么采用动态时频划分,传送划分的边信息,增大码率以提升音质;要么以音质下降为代价采用固定的时频划分,降低码率。(www.xing528.com)
与MP3、AAC等编解码系统相比,现在的空间参数编码系统可在24~64kbps码率范围内,平均MOS分提高0.5左右,并随着码率下降编码音质优势更为明显[10],因此可在对音质和码率要求严格的音频广播和移动音频中得到应用。但是值得注意的是此时的空间音频编码结构在移动应用的适应性上有两大问题:
(1)声源分离复杂度问题。
当前空间参数编码系统都采用频带划分来区分信号中不同的声源,为降低编码复杂度,避免传送子带划分信息带来的码率增加,通常采用独立于信号特性的静态划分方法,从而不利于编码音质提升。
(2)编解码系统延时问题。
当前空间参数编解码系统在结构上固有的缺陷,编解码端的时频分析模块引入了至少一帧的延时,通常在20~40ms之间,不利于双向实时通信。
下面分别针对以上所述的当前空间音频编码结构存在的问题,展开本章研究的两个重点内容:无边信息的动态频带划分编码框架构建以及并行滤波共享的编码结构设计。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。