基于SSIM的率失真模型优化

时间：2023-06-24 理论教育版权反馈

【摘要】：从式可以看出，SSIM能提取视场中的结构信息，其计算出的SSIM值与视频帧的主观质量具有高度的一致性，并能反映出亮度自适应与纹理掩蔽效果，较MSE能更准确地符合人眼的视觉感知。在式的基础上，为充分利用SSIM与人眼的视觉感知一致性较强的优点，建立了基于SSIM的率失真模型，并将其应用于BU层的码率控制。

基于SSIM的率失真模型优化

率失真模型是码率控制的理论基础，但目前在针对H.264/AVC、MPEG中的码率控制方法中，所采用的率失真模型都是基于视频帧中像素点的均方误差（MSE）或峰值信噪比（PSNR）来建立。MSE与PSNR分别采用下式计算而得：

其中，xi为原始视频帧中的像素值， pagenumber_ebook=144,pagenumber_book=132 表示对应视频帧在解码端重建后的像素值。这种视频客观质量评估方法虽然计算简单，但与人眼的视频主观质量并不匹配。事实上，实验早已证明，人眼对视频帧中的结构信息更加敏感。基于此，文献[11]设计了基于结构相似（SSIM）的视频质量评估方法，其评估结果与MOS 等视频主观质量评估方法的结果高度一致，得到广泛的应用。

SSIM对原始视频帧x和失真后的帧y分别从亮度、对比度和结构相似性等三个方面进行比较，即SSIM包含了视频帧的对比度、亮度及结构度等几方面的信息。相关的定义如下：

且有

其中，x，y分别表示参考图像与噪声图像对应位置的宏块； l（x，y）、c（x，y）、s（x，y）分别为亮度函数、对比度函数与结构函数； μx、μy分别为x，y的平均值； σx、σy为x，y的标准差； σxy为x，y的协方差。C1，C2，C3 为三个常数，其作用是在具有极低的亮度与对比度的宏块中保证SSIM的稳定性。从式（8.17）可以看出，SSIM能提取视场中的结构信息，其计算出的SSIM值与视频帧的主观质量具有高度的一致性，并能反映出亮度自适应与纹理掩蔽效果，较MSE能更准确地符合人眼的视觉感知。

此外，为了在带宽受限的情况下尽可能地提高视频编码效率，采用在视频编码器中得到广泛应用的率失真优化理论，在给定的比特约束条件下采用失真最小的编码模式，以输出稳定的视频数据流。将率失真优化表示为

为便于求解，采用拉格朗日乘数法将式（8.21）转化为如下形式：(www.xing528.com)

其中，S 为信源，Cmode为编码模式，R′为限定的比特数，R（S，Cmode）表示信源S在采用模式Cmode时编码器输出的比特数，λ为拉格朗日算子。

在式（8.22）的基础上，为充分利用SSIM与人眼的视觉感知一致性较强的优点，建立了基于SSIM的率失真模型，并将其应用于BU层的码率控制。首先，从式（8.17）可以看出，两个视频帧中的宏块相似度越高，计算出的SSIM值越接近1，故第i帧的SSIM值可以采用下式计算：

式中，SSIMi，s为第i帧中第s个BU的SSIM值。进而可将第i帧的失真表示为

相应的率失真函数表示为

其中，α，β 为参数，其初值分别取0.15 和1.035。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈

研究成果

注意事项

解决方案

计算方法

发展趋势

中国古代

社会主义

心理健康

控制系统

经济发展

建筑工程

传统文化

民事诉讼

中国传统

程序设计

解决方法

轨道交通

工程施工

研究结果

建设工程

文史资料

持续发展

计算机网

使用方法

基于SSIM的率失真模型优化

相关推荐

基于SSIM的率失真模型优化

有关视频编码及传输技术研究的文章

相关推荐