首页 理论教育 了解恰可察觉失真模型

了解恰可察觉失真模型

时间:2023-06-24 理论教育 版权反馈
【摘要】:众所周知,视觉感知的特征包括对比敏感度及掩盖效应。事实上,对比敏感度及掩盖效应表明了视频帧对人眼而言可以容忍一定程度的失真。这个值称为JND,代表了视频帧中视觉冗余的大小。从式(8.6)所示的JND模型可知,利用两个相邻帧的亮度的方差来计算时域JND,其计算精度会有所提高。此外,由于结合了像素域的时域和空域JND,与变换域的JND模型相比,该模型具备了计算复杂度低、精度较高的特点。

了解恰可察觉失真模型

在视频传输系统中,接收端的视频质量最终是由人眼来感知的。换言之,码率控制过程中应考虑到人眼视觉感知的特征,以更好地消除相关的冗余数据。众所周知,视觉感知的特征包括对比敏感度及掩盖效应。这表明人眼在观看视频时其注意力通常集中在某一区域或某些纹理结构上,而目前视频编码器所采用运动估计与补偿等帧内/帧间预测编码、整数/小波变换等技术,只能在一定程度上消除视频的时间与空间冗余,并没有考虑到对比敏感度及掩盖效应,无法很好地消除视觉冗余。结合人眼视觉感知,设计效率更高的码率控制方法,是进一步提高视频压缩质量及网络适应能力的一个重要手段。

事实上,对比敏感度及掩盖效应表明了视频帧对人眼而言可以容忍一定程度的失真。这个值称为JND,代表了视频帧中视觉冗余的大小。即在视频传输系统中,接收端解码后视频的失真在超过一定的值时,才会引起人类视觉系统的感知。因此,在建立JND模型的基础上,在码率控制中对具有较小JND的视频帧分配较多的比特,而对具有较大JND的视频帧分配较少的比特,可有效消除人眼不易察觉的视觉冗余信息,同时也在保证视频质量的基础上降低了编码器的输出码率,节省了网络带宽

JND模型可分为像素域的JND模型和基于离散余弦变换/小波变换的JND模型。为降低计算复杂度并提高建模的准确性,本章的码率控制方法中采用了像素域的JND模型。相应的第i帧的像素域JND为

其中,ζ为第i帧亮度均值,由下式求得:

式中,M和N分别表示第i帧水平与垂直方向的像素个数,Ls,t为对应像素的亮度值,α1,α2,α3 为参数。根据文献[9]的分析,将各参数的值分别取为4.65、2.45、3.92。式(7.6)中的JNDs(x,y,i)为第i帧的空域JND,其计算方法为

其中,Tl(x,y,i)为亮度自适应掩蔽值,Tt(x,y,i)表示纹理掩蔽值,Cl,t为掩蔽中的叠加效果。正如文献[9]所分析,极亮或极暗的区域能隐藏更多的噪声。相应地,有以下关系:

其中,θ1,θ2,θ3,θ4 为参数,其值在实验中取经验值,这里分别取17,3,3,3。I(x,y)为平均背景亮度,可表示为

其中,B(k,j)为3 ×3 的低通滤波器,其目的是求出当前编码像素周边8 个像素的加权平均。(www.xing528.com)

从式(8.10)可以看出,I(x,y,i)表示人眼敏感度与背景亮度的关系,当其值为127 时,人眼敏感度达到了最大值,二者的关系在文献[10]中已进行了详细的分析。针对纹理掩蔽值Tt(x,y,i)在计算过程没有考虑边缘区域、计算精度较低的不足,对视频帧中的纹理、边缘区域赋以不同的权重,从而得到

其中,ξ为参数,C(x,y,i)表示第i帧中像素(x,y)的梯度的加权平均的最大值,We(x,y,i)表示第i帧中像素(x,y)通过边缘检测和滤波取得的权重值。此外,式(8.6)中的时域JND是根据相邻两帧亮度的方差来进行计算,相应的时域掩蔽效应可用下式表示:

其中,Δ(x,y,i)表示第i帧与前一帧的平均帧间亮度,τ取1.92。

从式(8.6)所示的JND模型可知,利用两个相邻帧的亮度的方差来计算时域JND,其计算精度会有所提高。此外,由于结合了像素域的时域和空域JND,与变换域的JND模型相比,该模型具备了计算复杂度低、精度较高的特点。但考虑到视频传输的实时性要求,在计算JND时,采用在一个GOP中,按帧的类型分别计算其JND的方法。首先,对GOP中的第一帧,即I帧直接按式(8.6)计算JND。其次,对剩余的帧,即B帧和P帧按下列方法计算JND:

其中,A(i,i-1)为两个相邻帧的亮度值的差,即帧差。由下式计算:

其中,Ls,t′表示前一帧中对应像素的亮度值,M′与N′分别为前一帧水平与垂直方向的像素数量,θ5 取1.7。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈