率失真模型是码率控制的理论基础,但目前在针对H.264/AVC、MPEG中的码率控制方法中,所采用的率失真模型都是基于视频帧中像素点的均方误差(MSE)或峰值信噪比(PSNR)来建立。MSE与PSNR分别采用下式计算而得:
其中,xi为原始视频帧中的像素值,表示对应视频帧在解码端重建后的像素值。这种视频客观质量评估方法虽然计算简单,但与人眼的视频主观质量并不匹配。事实上,实验早已证明,人眼对视频帧中的结构信息更加敏感。基于此,文献[11]设计了基于结构相似(SSIM)的视频质量评估方法,其评估结果与MOS 等视频主观质量评估方法的结果高度一致,得到广泛的应用。
SSIM对原始视频帧x和失真后的帧y分别从亮度、对比度和结构相似性等三个方面进行比较,即SSIM包含了视频帧的对比度、亮度及结构度等几方面的信息。相关的定义如下:
且有
其中,x,y分别表示参考图像与噪声图像对应位置的宏块; l(x,y)、c(x,y)、s(x,y)分别为亮度函数、对比度函数与结构函数; μx、μy分别为x,y的平均值; σx、σy为x,y的标准差; σxy为x,y的协方差。C1,C2,C3 为三个常数,其作用是在具有极低的亮度与对比度的宏块中保证SSIM的稳定性。从式(8.17)可以看出,SSIM能提取视场中的结构信息,其计算出的SSIM值与视频帧的主观质量具有高度的一致性,并能反映出亮度自适应与纹理掩蔽效果,较MSE能更准确地符合人眼的视觉感知。
此外,为了在带宽受限的情况下尽可能地提高视频编码效率,采用在视频编码器中得到广泛应用的率失真优化理论,在给定的比特约束条件下采用失真最小的编码模式,以输出稳定的视频数据流。将率失真优化表示为
为便于求解,采用拉格朗日乘数法将式(8.21)转化为如下形式:(www.xing528.com)
其中,S 为信源,Cmode为编码模式,R′为限定的比特数,R(S,Cmode)表示信源S在采用模式Cmode时编码器输出的比特数,λ为拉格朗日算子。
在式(8.22)的基础上,为充分利用SSIM与人眼的视觉感知一致性较强的优点,建立了基于SSIM的率失真模型,并将其应用于BU层的码率控制。首先,从式(8.17)可以看出,两个视频帧中的宏块相似度越高,计算出的SSIM值越接近1,故第i帧的SSIM值可以采用下式计算:
式中,SSIMi,s为第i帧中第s个BU的SSIM值。进而可将第i帧的失真表示为
相应的率失真函数表示为
其中,α,β 为参数,其初值分别取0.15 和1.035。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。