MPEG-1第三部分及MPEG-2第三部分均是音频压缩编码标准。在MPEG音频压缩编码标准中,规定了3个不同层次的编码方案,即层次(1ayer)Ⅰ、层次Ⅱ及层次Ⅲ。其中层次Ⅰ及Ⅱ采用的是欧洲的MUSICAM(掩蔽型自适应通用子带综合编码和复用)算法,压缩比可达6倍以上,已被用于DAB、DVB及CD的音频编码。层次Ⅲ以MUSICAM算法为基础,综合ASPEC(音频频谱听觉熵编码)算法的优点,算法最复杂,但提供了最强的压缩能力,即使工作在54kbit/s(即压缩比达12∶1时)的传输码率,仍能保证高品质的音响效果。MPEG-2的音频压缩编码标准除了兼容MPEG-1外,主要服务于多声道、多语种,以及将MPEG-1音频的采样频率向下扩展(16kHz、22.05kHz及24kHz),以降低数据率。
MPEG标准强调人的听觉心理声学模型的利用。它可以利用估计听觉掩蔽阈值、量化精度、尺度化等各种压缩手段进行压缩编码。
MPEG规定了不同的编码层次以满足不同的编码系统要求。层次越高性能越好,但编码器也越复杂。MPEG-1音频压缩编码的应用和主要参数如表1-4所示。
表1-4 MPEG-1音频压缩编码的应用和主要参数
1.层次Ⅰ
将数字音频输入分解成32个子带的映射变换,将数据按一定格式分组的固定分割,确定自适应比特分配的心理声学模型(该模型称为模型1),定义了子带系数的量化精度(4bit)及尺度因子(6bit)。单声道码率为192kbit/s,立体声时为384kbit/s。具有相对简单的编码解码器。
音频帧是MPEG音频序列的基本访问单元,它主要由4部分组成,即32位帧头、16位的CRC纠错校验位、可变长度的音频数据及可变长度的附加位。
图1-36为MPEG音频层次Ⅰ的简化帧格式。它共有384个音频PCM样元。帧周期在32kHz时为12ms,44.1kHz时为8.7ms,48kHz时为8ms。
图1-36 MPEG音频层次Ⅰ的简化帧格式
2.层次Ⅱ
提供对比特分配、尺度因子和采样的附加编码,在同等音频质量时,层次Ⅱ仅要求层次Ⅰ负担30%~50%的码率,但增加了编码器和解码器的复杂性。码率是固定的,每条信道从32~192kbit/s,高保真度质量时每条信道从128kbit/s开始(立体声为256kbit/s)。心理声学模型和层次Ⅰ相同,但帧宽度是层次Ⅰ的3倍。为了减少码率,子带系数的量化精度随频串升高而减少,低频带为4bit,中间频带为3bit,高频带为2bit。
层次Ⅱ帧格式如图1-37所示。该帧由12个小组组成,每一个表示96(3×32)个PCM音频样元,故共有1152个音频样元。帧周期为层次Ⅰ的3倍,32kHz时为36ms,44.1kHz时为26.1ms,48kHz时为24ms。
层次Ⅰ、Ⅱ音频编码器框图如图1-38所示,层次Ⅰ、Ⅱ音频解码器框图如图1-39所示。(www.xing528.com)
图1-37 MPEG音频层次Ⅱ的简化帧格式
图1-38 层次Ⅰ、Ⅱ音频编码器框图
图1-39 层次Ⅰ、Ⅱ音频解码器框图
3.层次Ⅲ
MPEG层次Ⅲ是综合MUSICAM算法及ASPEC算法的优点后提出的新的掩蔽型编码算法。它采用混合带通滤波器来提高频率分辨率,它还增加了非均匀量化,自适应分段和量化值熵编码技术,从而提高了编码效率。层次Ⅲ采用霍夫曼编码及基于DCT的信号分析代替了使用在层次Ⅰ及Ⅱ中的子带编码。在相同的声音质量下层次Ⅲ的压缩率是层次Ⅱ的2倍,但编解码器更为复杂。高保真度质量时每条通道只要64kbit/s的码率(立体声为128kbit/s)。层次Ⅲ主要应用在低比特率的媒体中(如ISDN中),一般不用在数字电视中。但层次Ⅲ的解码器应能解层次Ⅰ及Ⅱ的音频码流。
在数字视频广播DVB标准中,采用MPEG-1层次Ⅰ及层次Ⅱ,共有4种主要的工作模式:立体声、联立立体声(为了减少码率利用左路和右路信道的冗余度)、双声道、单声道。
层次Ⅲ音频编码器框图如图1-40所示,层次Ⅲ音频解码器框图如图1-41所示。
图1-40 层次Ⅲ音频编码器框图
图1-41 层次Ⅲ音频解码器框图
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。