MPEG-1(ISO/IEC11172)标准的第三部分(ISO/IEC 11172-3),称为MPEG-1 Audio。
(一)MPEG-1音频的三种层次
MPEG-1Audio按照压缩编码的复杂程度规定了三种层次,即LayerⅠ、LayerⅡ和LayerⅢ,每个层次针对不同的应用,但是三个层的基本模型是相同的。
(二)Layer I音频编码器
Layer I音频编码器框图如图7-72所示。
图7-72 Layer I音频编码器
1.多通道滤波器
将输入音频信号变换成32个等宽频带子带。
2.心理声学模型
MPEG音频心理声学模型主要实现步骤如下。
(2)将得到的频率组成临界频带。
(3)在临界频带的谱值中,将单音(似正弦)和非单音(似噪声)分开。
(4)在临界频带决定噪声掩蔽阈值之间,模型在不同的临界频带给信号应用适当的掩蔽函数。
(5)计算由临界频带引起的每个子带的掩蔽值。
(6)计算每个子带的SMR。
3.比特分配
比特分配过程决定分配给各个子带的编码比特数,分配的依据是心理声学模型的信息。Layer I和Layer II的比特分配过程是从计算掩蔽噪声比开始的(MNR=SNR-SMR)。
4.比例因子
按输入信号的大小来缩放量化步长,输入信号小用较小的量化步长,输入信号大用较大的量化步长。(www.xing528.com)
5.码流格式化——帧形成
MPEG-1音频数据是分成帧(frame)传送的,LayerⅠ每帧由32个子带,每个子带12个样值,共384个样值的数据组成。LayerⅠ的帧结构如图7-73所示。
图7-73 LayerⅠ的帧结构图
(三)LayerⅡ的特点
LayerⅡ和LayerⅠ编码原理类似,不同之处有以下几点:
LayerⅡ的每个子带不是均匀带宽;
LayerⅡ使用的FFT精度高一些;
LayerⅡ的帧长度码流是LayerⅠ的3倍;
LayerⅡ和LayerⅠ帧结构的不同之处在于描述比特分配的比特位数是不一样的。
LayerⅡ的帧包含1152个PCM的样值,如果取样频率为48kHz,一帧相当于1152/48k=24ms的声音样值,这样LayerⅡ的精确度为24ms,而对于LayerⅠ来言,精确度为8ms,如果用于编辑的话,LayerⅠ更精确。
LayerⅡ音频编码器和帧结构分别如图7-74和图7-75所示。
图7-74 LayerⅡ音频编码器
图7-75 LayerⅡ码流结构图
(四)LayerⅢ
Layer Ⅲ(也即MP3)采用了Layer Ⅰ和Layer Ⅱ未用到的技术。Layer Ⅲ编码器框图如图7-76所示。
图7-76 LayerⅢ编码器框图
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。