首页 理论教育 预测编码技术及其基本原理

预测编码技术及其基本原理

时间:2023-06-27 理论教育 版权反馈
【摘要】:预测编码是根据某一模型利用过去的样值对当前样值进行预测,然后将当前样值的实际值与预测值相减得到一个误差值,只对这一预测误差值进行编码,目的是减少数据在时间和空间上的相关性。(一)预测编码基本原理典型的预测编码系统如图7-5所示。所以可以根据预测误差处于某一门限值范围进行分类,并控制可变编码器的参数使其与相应的信源统计特性相匹配,从而提高预测精度,减小预测误差,减小量化分层总数,可进一步压缩编码率。

预测编码技术及其基本原理

预测编码是根据某一模型利用过去的样值对当前样值进行预测,然后将当前样值的实际值与预测值相减得到一个误差值,只对这一预测误差值进行编码,目的是减少数据在时间和空间上的相关性。预测误差信号比原始信号小得多,因而可以用较少的电平等级对预测误差信号进行量化,从而可以大大减少传输的数据量。

(一)预测编码基本原理

典型的预测编码系统如图7-5所示。

图7-5 预测编码系统框图

在编码端,设当前时刻n输入的信号样值为xn,预测器根据n时刻之前的相邻样值x1,x2,......,xn-1对当前时刻样值xn进行预测,预测值为:

其中,a1,a2,......,an-1称为预测系数。

图7-5中的加法器实际上是一个减法器,作用是把当前的实际样值xn与预测值相减,计算出预测误差en=xn-。量化器的作用是对预测误差en进行量化,输出为,量化误差为Δxn=en-。由于量化器量化的是预测误差值en,其动态范围较小,量化后的值大部分为0。编码器根据的大小和出现的概率进行二进制代码 编码。

在接收端,解码器从接收的二进制代码中恢复,两端预测器完全相同,根据n时刻之前的相邻样值来预测当前时刻样值,预测器的输出为,在加法器中比较编码端输入xn和解码端输出,可得整个编解码过程的误差为:

这就是编码器的量化器带来的量化误差,这种带量化器的预测编码就是有损压缩编码。预测器是预测编码中的关键部分,预测精度越高,预测误差信号的动态范围就越小,输出码率就越低。

(二)预测方法

预测方法分为帧内预测和帧间预测。

1.帧内预测

帧内预测利用图像信号的空间相关性来压缩图像的空间冗余,根据前面已经传送的同一帧内的像素来预测当前像素,如图7-6所示。

图7-6 帧内预测示意图

帧内预测(空间冗余压缩编码)是在一帧(或一场)内进行的,它利用了电视图像信号的空间相关性来消除一帧(或一场)内图像的冗余信息。

帧内预测又分为以下方法:

(1)前值预测:用同一扫描行中最相邻的前一个亮度信号的样值来预测。

(2)一维预测:用同一扫描行中前几个样值来预测当前像素。

(3)二维预测:用同一扫描行和上几个行中的几个样值来预测当前像素。

2.帧间预测

电视图像在相邻帧之间存在很强的相关性。又称为三维预测,用前一帧像素来预测当前帧像素,这种预测器需要用大容量的帧存储器存储前一帧的图像,如图7-7所示。

帧间预测(时间冗余压缩编码)是在相邻帧之间进行,它利用了电视图像信号的时间相关性来消除相邻帧之间的冗余信息。这种方式对静止图像或缓慢运动图像有很强的压缩能力。

图7-7 帧间预测示意图

3.预测系数的选择

预测系数的选择通常采用最优线性预测法,选择预测系数a1,a2,……,an-1使误差信号en的均方值最小,所有系数代数和为1。

4.自适应预测

自适应预测又称为非线性预测,可以利用预测误差作为控制信息,因为预测误差的大小反映了图像信号的相关性。在亮度变化平坦区,相关性强,预测误差小;而边沿区或细节多的区域,相关性弱,预测精度差,预测误差大。所以可以根据预测误差处于某一门限值范围进行分类,并控制可变编码器的参数使其与相应的信源统计特性相匹配,从而提高预测精度,减小预测误差,减小量化分层总数,可进一步压缩编码率。

(三)预测量化器

1.预测误差的统计特性

由于图像信号在帧内和帧间存在着一定的相关性,预测误差统计特性的一个特点就是它的概率分布集中在0附近的一个较窄的范围内,0值出现的概率最大。随着预测误差绝对值的增大其出现的概率迅速下降,如图7-8所示。

图7-8 预测误差概率分布及非均匀量化曲线

2.量化器设计

在预测编码中可以采用非均匀量化,非均匀量化特性曲线如图7-9所示。

图7-9 非均匀量化特性曲线

绝对值小的预测误差值主要出现在平坦区,量化误差容易被察觉,因此应该细量化。反之,粗量化。

近几年来被认为是效果较好的量化器设计方法是利用主观实验进行最优化设计。

(四)图像帧间编码中的运动处理(www.xing528.com)

通常,电视节目中只要镜头不切换,前后帧运动图像的内容就基本没变化,许多情况下仅有很少内容在运动。因此,只要知道画面中什么内容在运动及其运动方向和位移量,就可以根据前一帧图像内容估计出当前帧图像。

1.运动处理原理

在图像的运动处理中主要有两个过程:第一个过程为运动估计(Motion Estimation,ME)。运动估计是对运动物体的位移作出估计,即估计出运动物体从上一帧到当前帧的位移方向和位移量,也就是估计出运动矢量(MV)。第二个过程为运动补偿(Motion Compensation,MC),运动补偿是按照运动矢量将上一帧作位移,求出当前帧的运动结果,如图7-10所示。

将当前帧fn(x,y)和前一帧fn-1(x,y)之间作运动估计,通过匹配搜索产生运动矢量(MV),用这个运动矢量将前一帧中的匹配块移位,求得当前帧的估计值这个估计值和当前帧的差值为将en送去量化编码后传输,同时传送的还有运动矢量(MV)。

图7-10 运动处理原理框图

接收端根据接收到的运动矢量(MV)和差值en(x,y),即可由前一帧重建当前帧。

可见,运动估计是是帧间运动处理中的关键步骤,运动估计的目的是利用其结果作运动补偿,以获得尽可能小的预测误差。

2.运动估计的方法

运动估计先要建立运动模型,实际的前景运动规律有水平和垂直方向内的移动、旋转和缩放等运动,运动方向和速度还可能随时间变化,使这运动模型的建立和参量的估值比较困难。下面主要讨论数字视频中常见的运动方式,即物体作直线匀速平移运动,如图7-11所示。

图7-11 运动物体的帧间位移

前一帧中,运动物体某点的坐标为(x0,y0),在当前帧中,该点移至(x1,y1)处,运动矢量为D,帧间运动像素坐标的形式为:

x1=x0+Δx,y1=y0+Δy

可以看出,如果直接求两帧图像对应坐标之间的差值,运动物体部分两帧之间差值会很大,若能对运动物体部分进行运动估计和适当位移,将大大减小差值。

问题的关键是怎样进行运动估计以得出准确的位移矢量D,运动估值的方法有很多,如块匹配法、像素递归法、相位相关法和针对摄像机本身运动引起画面整体运动参数估值等。由于块匹配法硬件复杂度小,广泛应用在数字视频压缩国际标准中。

3.块匹配法

把图像分成若干子块称为宏块(Macro Block,MB),设宏块图像是由N×N个像素组成的像块,并假设一个像块内的所有像素作一致的平移运动。

块匹配法计算中,使当前帧中的每一个宏块(MB)针对前一帧内的像块在上下左右四个方向搜索,求得与其最佳的匹配块,搜索范围通常限制在水平和垂直(-M,M)范围内,即在(N+2M)×(N+2M)个像素范围(称为搜索窗口)内搜索。块匹配法中,需要选择几个最重要的参数:

(1)估值块大小(N×N)

估值块大小的选择应该综合考虑图像细节构成和计算量等因素,通常,运动估值宏块的大小为16×16像素。

一帧标清电视的亮度有720×576个像素、45×36=1620个宏块,色差信号不需要作运动估计,可直接使用亮度信号的运动矢量。

(2)最佳匹配准则

判断两个宏块间最佳匹配准则有很多种,常用的准则有两种。一是最小均方差值(MSE)准则,定义为:

式中,fn(x,y)为当前帧即第n帧的像素值,i、j分别为水平、垂直方向上的位移量。当MSE最小时,表示两宏块间匹配最佳,由此得出位移矢量。

二是绝对差的均值(MAD最小准则),定义为:

实际上是两宏块间数据的绝对差的均值。

(3)搜索窗口大小

搜索窗口的选择应综合考虑帧间运动位移的可能大小和计算量等因素,M越大,计算次数越多。

在全搜索法中,最大搜索次数为:

nmax=(2M+1)(2M+1)2

如:M=16,nmax=1089。

由于一帧标清电视有1620个亮度宏块,实时运算中每秒需处理25帧,因此每秒需要搜索计算44×106次。

(4)快速搜索法

快速搜索法可以减少搜索次数,目前有多种快速搜索法,如全搜索法、三步法、共轭方向法、正交搜索法等。下面以二维对数法为例介绍快速搜索法的基本原理,如图7-12所示。

图7-12 二维对数法图

从宏块中心点(i,j)开始,每一步在中心点及其左、右、上、下共5个点上计算匹配值。取其中MAD值最小的点作为下一步的中心点,并重复此步骤,最终找到最佳匹配位置。图中,经过5步后,在(i+2,j+6)点找到位移矢量,前4步每次移动2个像素距离,第5步移动1个像素距离。此法最大搜索次数nmax=2+7log2(Δm),Δm为最大搜索位移。

(5)分级搜索

分级搜索则把搜索过程分为粗搜索和细搜索两步来进行,首先对图像进行亚取样得到一个低分辨率的图像,然后再对所得到的低分辨率图像进行全搜索,由于分辨率低,称为粗搜索。然后以粗搜索的结果为细搜索的起始点,再在高分辨率图像中较小的范围进行细搜索,修改运动矢量。这样总的搜索次数可大大减少,如图7-13所示。

图7-13 分级搜索示意图

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈