首页 理论教育 杜比AC-3音频编码算法优化

杜比AC-3音频编码算法优化

时间:2023-06-21 理论教育 版权反馈
【摘要】:AC-3是由美国杜比实验室开发的音频编码算法。杜比AC-3可以把5个独立的全频带和一个超低音声道的信号实行统一编码,成为单一的复合数据流。当没有音频信号掩蔽时,杜比AC-3系统就集中力量降低或消除编码的噪声。杜比AC-3编码器原理框图如图5-2所示。AC-3算法通过对声音信号频域表示的粗量化,可以达到很高的编码增益。

杜比AC-3音频编码算法优化

AC-3是由美国杜比(Dolby)实验室开发的音频编码算法。该系统的音响效果为高保真立体环绕声,目前市场上流行的“家庭影院音响系统多数采用此算法。

杜比AC-3环绕声系统最多可有6个完全独立的声道:左声道(L)、右声道(R)、中置声道(C)、左环绕声道(LS)、右环绕声道(RS),以及一个低频音效增强(Low Fre-quency Enhancement,LFE)声道。其中前5个声道的频带范围为20Hz~20kHz,称为主声道,而LFE信道的频带限于20~120Hz,所以将此超低音声道称为“0.1”声道,加上前面5个声道,就构成杜比数字(AC-3)的5.1声道。杜比AC-3可以把5个独立的全频带和一个超低音声道的信号实行统一编码,成为单一的复合数据流。各声道间的隔离度高达90dB,两个环绕声道互相独立实现了立体声化,超低音声道的音量可独立控制。

AC-3编码系统的音频节目有两类:主要音频业务和辅助音频业务。主要音频业务包含除了对话以外所有音频节目的内容。辅助音频业务是要和主要音频业务一起使用的对话和解说词等。

根据不同用途,经AC-3压缩以后的数码率有以下4种:

1)主要音频业务的数码率:≤384kbit/s。

2)单声道辅助业务的数码率:≤128kbit/s。

3)双声道辅助业务的数码率:≤192kbit/s。

4)主要音频业务和辅助音频业务同时解码的组合数码率:≤572kbit/s。

这些数码率均远远低于PCM数字音频编码系统的数码率,但由于采用了全音域杜比降噪系统,音质并没有什么差别。杜比降噪系统是这样设计的:当没有音频信号时,降低或消除噪声,在其他时间用较强的音频信号掩蔽噪声。

在应用人的听觉掩蔽效应时,AC-3根据人的听觉频率选择性地把每个声道的音频频谱也分割成不同带宽的子频带,结果使噪声处在离音频信号频率分量很近的频率上,就很容易被音频信号所掩蔽。当没有音频信号掩蔽时,杜比AC-3系统就集中力量降低或消除编码的噪声。

除了降低噪声以保证音质外,杜比AC-3系统为降低数码率,对各频带采用不同的采样率,根据频谱或节目的动态特性来分配各频带的比特数。AC-3通过一个共享比特池(类似于缓冲存储器)来决定不同声道的比特数分配,频率高的声道分配的比特数多,频率低的声道分配的比特数少,这样可以用一个声道的强信号掩蔽其他声道的噪声。在每一声道中,必须保证每一频带所分配的比特数都足够多,以全部掩蔽声道内噪声。这一功能是通过听觉掩蔽模型使编码器改变它的频率选择性(以便动态地划分窄频带)来实现的。(www.xing528.com)

AC-3将多声道作为一个整体进行编码,比单声道编码效率高。同时,它对各个声道和每个声音内的各频带信号用不同的采样率进行量化,对噪声进行衰减或掩蔽,结果使系统的数码率降低而音质损害很小。

杜比AC-3编码器原理框图如图5-2所示。

978-7-111-34368-4-Chapter05-6.jpg

图5-2 AC-3编码器原理框图

AC-3编码器接收声音脉冲编码调制(PCM)数据,输出的是压缩后的码流。AC-3算法通过对声音信号频域表示的粗量化,可以达到很高的编码增益。首先把时间域内的PCM数据值变换为频域内成块的一系列变换系数。每个块有512个数据值,其中256个数据值在连续的两块中是重叠的,重叠的块被一个时间窗相乘,以提高频率选择性,然后被变换到频域内。由于前后两块重叠,每一个输入数据值出现在连续两个变换块内,因此,变换后的变换系数可以去掉一半而变成每个块包含256个变换系数,每个变换系数以二进制指数形式表示,即一个二进制指数和一个尾数。指数集反映了信号的频谱包络,对其进行编码后,可以粗略地代表信号的频谱。同时,用此频谱包络决定分配给每个尾数多少比特数。如果最终输出码流的数码率很高,而导致AC-3编码器溢出,此时要采用高频系数耦合技术,以进一步减少数码率。此后把6块(1536个声音数据值)频谱包络、粗量化的尾数以及相应的参数组成AC-3数据帧格式。

AC-3的音频码流是由一个同步帧的序列组成的,帧格式如图5-3所示。每个同步帧包含6个编码的音频块(AB),各个编码音频块由256个样本数据的码字构成。在各帧的开始有同步(SI)头,包含获取和保持同步的信息。在同步头之后是比特流信息(BSI)头,包含描述编码的音频业务的参数。编码音频块可后跟一个辅助数据(AUX)字段。在每一帧的末尾是一个误码检测字段,如循环冗余校验码(CRC)。

978-7-111-34368-4-Chapter05-7.jpg

图5-3 AC-3同步帧格式

各个编码音频块是一个可解码的实体,在对某个音频块进行解码时并不要求解码所需的信息都在这个块中。如果对块解码所需的信息可以被许多块共享,那么仅在第一块中传送所需的信息,并在后面的音频块解码时重复使用这个信息。由于各个音频块并不包含全部所需信息,所以在音频帧中的各个块大小各不相同,但所有6个块的总长度必须能够装进固定大小的帧。也能是说,某些块可以分配较多的比特,而其他块就要相应地减少比特,在第6块后面余下的任何信息可以作辅助数据(AUX)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈