AVS视频标准不同于H.264标准,后者是一个独立的视频标准,而AVS标准是一套包含系统、视频、音频、媒体版权管理在内的完整标准体系,这保证了实际应用系统所需的技术完备性。因此AVS视频标准具有技术高效、实现方案简洁,专利许可政策简单、许可费用低廉,相关标准配套的特色。
AVS视频编码技术:
AVS1-P2视频标准采用经典的混合编码框架,此框架与以往视频标准相同,但由于不同标准制订时出于对不同应用的考虑,在技术取舍上对复杂度-性能的衡量指标各不相同,因而在复杂性、编码效率上的表现也各不相同。比如,一般认为H.264的编码器大概比MPEG-2复杂9倍,而AVS视频标准则由于编码模块中的各项技术复杂度都有所降低,其编码器复杂度大致为MPEG-2的6倍,但编码高清序列AVS视频标准具有与H.264相近的编码效率。
视频编码的基本流程为:将视频序列的每一帧划分为固定大小的宏块,通常为16×16像素的亮度分量及两个8×8像素的色度分量,之后以宏块为单位进行编码。对视频序列的第一帧及场景切换帧或者随机读取帧采用I帧编码方式,I帧编码只利用当前帧内的像素作空间预测,类似于JPEG图像编码方式。其大致过程为,利用帧内先前已经编码块中的像素对当前块内的像素值作出预测,将预测值与原始视频信号作差运算得到预测残差,再对预测残差进行变换、量化及熵编码形成编码码流。对其余帧采用帧间编码方式,包括前向预测P帧和双向预测B帧,帧间编码是对当前帧内的块在先前已编码帧中寻找最相似块(运动估计)作为当前块的预测值(运动补偿),之后如I帧的编码过程对预测残差进行编码。编码器中还内含一个解码器,内嵌解码器模拟解码过程,以获得解码重构图像,作为编码下一帧或下一块的预测参考。解码步骤包括对变换量化后的系数进行反量化、反变换,得到预测残差,之后预测残差与预测值相加,经滤波去除块效应后得到解码重构图像。
以上编码框架包含如下关键技术:
1.帧内预测
AVS视频标准采用空域内的多方向帧内预测技术。以往的编码标准都是在频域内进行帧内预测,如MPEG-2的直流系数(DC)差分预测、MPEG-4的DC及高频系数(AC)预测。基于空域多方向的帧内预测提高了预测精度,从而提高了编码效率。AVC/H.264标准也采用了这一技术,其预测块大小为4×4及16×16,其中4×4帧内预测时有9种模式,16×16帧内预测时有四种模式。AVS视频标准的帧内预测基于8×8块大小,亮度分量只有五种预测模式,大大降低了帧内预测模式决策的计算复杂度,但性能与AVC/H.264十分接近。除了预测块尺寸及模式种类的不同外,AVS视频的帧内预测还对相邻像素进行了滤波处理来去除噪声。
2.变块大小运动补偿
变块大小运动补偿是提高运动预测精确度的重要手段之一,对提高编码效率起重要作用。在以前的编码标准MPEG-1、MPEG-2中,运动预测都是基于16×16的宏块进行的(MPEG-2隔行编码支持16×8划分),在MPEG-4中添加了8×8块划分模式,而在H.264中则进一步添加了16×8、8×16、8×4、4×8、4×4等划分模式。但实验数据表明小于8×8块的划分模式对低分辨率编码效率影响较大,而对于高分辨率编码则影响甚微。
在高清序列上的大量实验数据表明,去掉8×8以下大小块的运动预测模式,整体性能降低2%~4%,但其编码复杂度则可降低30%~40%。因此在AVS1-P2中将最小宏块划分限制为8×8,这一限制大大降低了编解码器的复杂度。
3.多参考帧预测
多参考帧预测使得当前块可以从前面几帧图像中寻找更好地匹配,因此能够提高编码效率。但一般来讲2~3个参考帧基本上能达到最高的性能,更多的参考图像对性能提升影响甚微。复杂度却会成倍增加。H.264最多可采用16个参考帧,并且为了支持灵活的参考图像引用,采用了复杂的参考图像缓冲区管理机制,实现较繁琐。而AVS视频标准限定最多采用两个参考帧,其优点在于:在没有增大缓冲区的条件下提高了编码效率,因为B帧本身也需要两个参考图像的缓冲区。(www.xing528.com)
4.1/4像素插值
MPEG-2标准采用1/2像素精度运动补偿,相比于整像素精度提高约1.5 dB编码效率;H.264采用1/4像素精度补偿,比1/2精度提高约0.6 dB的编码效率,因此运动矢量的精度是提高预测准确度的重要手段之一。影响高精度运动补偿性能的一个核心技术是插值滤波器的选择。AVC/H.264亚像素插值半像素位置采用6拍滤波,这个方案对低分辨率图像效果显著。由于高清视频的特性,AVS视频标准对1/2像素位置插值采用4拍滤波器,其效果与6拍滤波器相同,优点是大大降低了访问存取带宽,是一个对硬件实现非常有价值的特性。
5.B帧宏块编码模式
在AVC/H.264标准中,时域直接模式与空域直接模式是相互独立的。而AVS视频标准采用了更加高效的空域/时域相结合的直接模式,并在此基础上使用了运动矢量舍入控制技术——1/4像素插值,AVS标准B帧的性能比H.264中B帧性能有所提高。此外,AVS标准还提出了对称模式,即只编码前向运动矢量,后向运动矢量通过前向运动矢量导出,从而实现双向预测。此方案与编码双向运动矢量效率相当。
6.整数变换与量化
AVS视频标准采用整数变换代替了传统的浮点离散余弦变换(DCT)。整数变换具有复杂度低、完全匹配等优点。由于AVS1-P2中最小块预测是基于8×8块大小的,因此采用了8×8整数DCT变换矩阵。8×8变换比4×4变换的去相关性能强,在变换模块,AVS标准编码效率相比H.264提高2%(约0.1 dB)。同时与H.264中的变换相比,AVS标准中的变换有自身的优点,即由于变换矩阵每行的模比较接近,可以将变换矩阵的归一化在编码端完成,从而节省解码反变换所需的缩放表,降低了解码器的复杂度。
量化是编码过程中唯一带来损失的模块。以前典型的量化机制有两种,一种是H.263中的量化方法,一种是MPEG-2中的加权矩阵量化形式。与以前的量化方法相比,AVS标准中的量化与变换归一化相结合,同时可以通过乘法和移位来实现,对于量化步长的设计,量化参数每增加8,相应的量化步长扩大1倍。由于AVS标准中变换矩阵每行的模比较接近,变换矩阵的归一化可以在编码端完成,从而解码端反量化表不再与变换系数位置相关。
7.熵编码
熵编码是视频编码器的重要组成部分,用于去除数据的统计冗余。AVS视频标准采用基于上下文的自适应变长编码器对变换量化后预测残差进行编码。其具体策略为,系数经过“之”字形扫描后,形成多个(Run,Level)数对,其中,Run表示非零系数前连续值为零的系数个数,Level表示一个非零系数;之后采用多个变长码表对这些数对进行编码,编码过程中进行码表的自适应切换来匹配数对的局部概率分布,从而提高编码效率。编码顺序为逆向扫描顺序,这样易于局部概率分布变化的识别。变长码采用指数哥伦布码,这样可降低多码表的存储空间。此方法与H.264用于编码4×4变换系数的基于上下文的自适应变长编码器(CAVLC)具有相当的编码效率。相比于H.264的算术编码方案,AVS的熵编码方法编码效率低0.5 dB,但算术编码器计算复杂,硬件实现代价很高。
8.环路滤波
起源于H.263++的环路滤波技术的特点在于把去块效应滤波放在编码的闭环内,而此前去块效应滤波都是作为后处理来进行的,如在MPEG-4中。在AVS视频标准中,由于最小预测块和变换都是基于8×8的,环路滤波也只在8×8块边缘进行,与H.264对4×4块进行滤波相比,其滤波边数变为H.264的1/4。同时由于AVS视频滤波点数、滤波强度分类数都比H.264中的少,大大减少了判断、计算的次数。环路滤波在解码端占有很大的计算量,因此降低环路滤波的计算复杂度十分重要。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。