图像数据的压缩主要基于对各种图像数据冗余度及视觉冗余度的压缩。
(一)图像数据冗余度
图像数据冗余度有如下几种:
1.统计冗余度
对于一串由许多数值构成的数据来说,统计各个数值的出现频率,并按频率大小用相应的定长码组来表示。频率越大的数值的码组长度越小,反之越长。目前用于图像压缩的具体的熵编码方法主要是哈夫曼编码,即一个数值的编码长度与此数值出现的概率尽可能地成反比。哈夫曼编码虽然压缩比不高,约为1.6:1,但好处是无损压缩,目前在图像压缩编码中被广泛采用。
由于视频图像在每一点的取值上具有任意性,因此对于运动图像而言,每一点在一段时间内能取可能的任意值,在取值上具有统计均匀性,难以直接运用熵编码的方法,但可以通过适当的变换编码的方法,如离散余弦变换(DCT),使原图像变成由一串统计不均匀的数据来表示,从而利用哈夫曼编码来进行压缩。
图7-1 空间冗余
2.空间冗余度
一幅视频图像相邻各点的取值往往相近或相同,具有空间相关性,这就是空间冗余度,如图7-1所示。
图中,蓝色像素取值完全相同,其他颜色相邻像素取值相同或相近。
图像的空间相关性表示相邻像素点取值变化缓慢。从频域的观点看,意味着图像信号的能量主要集中在低频附近,高频信号的能量随频率的增加而迅速衰减。通过频域变换,可以将原图像信号用直流分量及少数低频交流分量的系数来表示,这就是变换编码中的DCT方法。DCT是JPEG和MPEG压缩编码的基础,可对图像的空间冗余度进行有效的压缩。
图7-2 时间冗余度
3.时间冗余度
时间冗余度表现在电视画面中相继各帧对应像素点的值往往相近或相同,具有时间相关性,这就是时间冗余度,如图7-2所示。
图中,前后两幅图像基本相同,仅仅是鲨鱼的位置变化了。
在知道了一个像素点的值后,利用此像素点的值及其与后一像素点的值的差值就可求出后一像素点的值。因此,不传送像素点本身的值而传送其与前一帧对应像素点的差值,也能有效地压缩码率,这就是差分编码(DPCM)。在实际的压缩编码中,DPCM主要用于各图像子块在DCT变换后的直流系数的传送。相对于交流系数而言,DCT直流系数的值很大,而相继各帧对应子块的DCT直流系数的值一般比较接近,在图像未发生跳变的情况下,其差值同直流系数本身的值相比是很小的。
4.结构冗余度
图像从时域上看存在着非常强的纹理结构,称之为结构冗余。例如红砖房、布纹图像和草席图像,我们说它们在结构上存在冗余,如图7-3 所示。(www.xing528.com)
5.知识冗余度
人类对许多图像的理解是根据某些已知的知识,例如人脸的图像有固定的结构,这些规律性的结构可由先验知识和背景知识得到,称之为知识冗余,如图7-4所示。
6.视觉冗余度
视觉冗余度是相对于人眼的视觉特性而言的。人眼对于图像的视觉特性包括对亮度信号比对色度信号敏感、对低频信号比对高频信号敏感、对静止图像比对运动图像敏感以及对图像水平线条和垂直线条比对斜线敏感等。因此,包含在色度信号、图像高频信号和运动图像中的一些数据并不能对增加图像相对于人眼的清晰度作出贡献,而被认为是多余的,这就是视觉冗余度。
图7-3 结构冗余
图7-4 结构冗余和知识冗余
压缩视觉冗余度的核心思想是去掉那些相对人眼而言是看不到的或可有可无的图像数据。对视觉冗余度的压缩通常已反映在各种具体的压缩编码过程中。现有DCT变换、行游程编码、DPCM、帧间预测编码及哈夫曼编码等编码方法,已被有关国际组织定为压缩编码的主要方法。
(二)人眼的视觉特性
人眼的视觉特性是图像压缩编码的另一个重要依据,主要有以下四个方面:
1.亮度辨别阈值
亮度辨别阈值是指人眼刚刚能察觉到的亮度变化值,当景物的亮度在背景亮度基础上增加很少时,人眼是辨别不出的,只有当亮度增加到某一数值时,人眼才能感觉其亮度有变化。
2.视觉阈值
视觉阈值是指干扰或失真刚好可以被察觉的门限值,低于它就察觉不出来,高于它才看得出来,这是一个统计值。所以,用视觉阈值确定是否存在失真比较容易。
3.空间分辨力
空间分辨力是指对一幅图像相邻像素的灰度和细节的分辨力,视觉对于不同图像内容的分辨力不同。对于静止图像,视觉具有较高的空间分辨力。对于活动图像,视觉具有较低的空间分辨力,且随着运动速度的提高而迅速下降。
4.掩盖效应
掩盖效应是指人眼对图像中量化误差的敏感程度,与图像变化的剧烈程度有关。亮度变化越剧烈,量化误差越容易被掩盖,人眼不易察觉,相反在亮度缓慢变化的平坦区误差容易被觉察。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。