研究视频数据传输过程中的丢包率对视频失真的影响,对提高视频传输的可靠性具有重要作用。但分析视频失真与丢包率的关系,首先要解决视频失真的计算问题,换言之,如何对视频质量进行评估。考虑到视频质量评估本质上是用户的主观体验,一种常用的视频质量评估策略为平均意见分(Mean Opinion Score,MOS),由多个评测人员对视频播放效果打分,相应的失真表示为5-MOS。具体的MOS 值及其含义如表3-1 所示。
表3-1 MOS值与对应的视频质量
上述方法虽然可靠,但实时性差,并不符合视频传输的实时性要求。实际中常用的是基于均方误差(Mean Squared Error,MSE)的视频质量评估方法。MSE采用下式计算:
其中,xi和为原始帧与解码后的帧对应的像素值,N为该帧中像素的数量。
由于编解码器采用了预测编码、量化等手段提高视频压缩效率,在接收端解码后的视频序列不可避免地存在失真的现象。因此,先考虑由编解码过程引起的视频失真,其大小由下式计算:
式中,Di为第i帧的失真; Qi,max为第i帧原始质量; Qpi为第i帧量化参数; Qi为编码后该帧的质量; Ti为量化参数的阈值; c为常数,通常采用对实验结果进行拟合的方法得到。
可以看出,编解码过程中失真的大小主要由量化参数决定,当量化参数小于Ti时,用户并不能察觉到视频质量的下降。通常二者之间呈线性关系。
一般情况下,编码过程中的失真Di较小,用户无法感知到视频质量的明显下降,此时失真Di可以容忍。然而在视频传输过程中,由于各种原因,视频数据包的丢包事件会以概率p发生,当失真大于某一阈值Dthresh,视频序列的播放质量下降,出现画面卡滞,甚至马赛克现象,会严重降低用户的主观体验质量。
上述的阈值Dthresh称为绝对损伤阈值,定量地显示了失真为多大时,人眼才能有所察觉。可表示为
其中,c代表视频显示屏幕的比例,ρ为视频播放时显示的图像分辨率与屏幕分辨率的比值,ω表示视敏度基准权值,φ表示用户观测距离与显示屏幕对角线的比值,A为帧的面积。Alight表示失真的像素总面积,表示为
(www.xing528.com)
在上述分析的基础上,考虑实时视频传输中的视频失真主要由丢包事件引起,根据文献[5],将数据丢包事件与失真的关系进行量化。考虑到在视频编码过程中,不同编码模式的宏块的抗误码性能也不同。对此,对二者的关系分帧内和帧间两种编码模式进行讨论。设第n 帧的第i个宏块采用了帧内编码模式,则其第j个像素到达接收端解码后的失真为
其中,为原始视频数据中第j个像素的值;分别为第j个像素重建后的值和编码器中的预测值; p为包含该像素的数据包发生丢包事件的概率;表示第j个像素丢失后,采用错误隐藏方法使用前一帧中对应的像素值代替丢失的像素; E[·]表示取[·]的期望值。则可得到第i个宏块的平均失真为
式中,C为第i个宏块中的像素数量。
现在考虑第二种情况,如第n 帧的第i个宏块采用了帧间编码模式,则第j个像素解码后的失真为
其中,分别为采用帧间编码时第j个像素在编码端的预测值和重建后的值。相应的第i个宏块的平均失真为
最后得到第n 帧在帧内编码模式时的失真为
而第n 帧在帧间编码模式时的失真为
其中,S 为第n 帧中的宏块数量。
显然,采用帧间编码模式时,由丢包事件引起的视频失真会影响其他帧,但这种失真的扩散只会局限于同一GOP中。需要指出的是,上述分析并没有考虑到多参考帧的情形,特别是没有针对B帧进行分析。因为实时视频的编码过程中GOP基本结构为IPP...,为减少编解码时延,一般不会采用B帧进行编码。通常,在针对视频存储的应用场合,如H.264 的主要档次(Main profile)才会大量使用多参考帧的帧间编码模式。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。