数据压缩,如WinRAR、ZIP等程序广为人知,是实现减少空间而把数据转换成比原始格式更紧凑形式的过程。数据压缩的概念相当古老,可追溯至19世纪中期的摩尔斯码。摩尔斯码发现某些字母比其他字母使用地更频繁(例如E比X),使用短的脉冲信号来表示常用字母,而使用较长脉冲信号表示非常用字母。这个压缩方案有效地改善了系统的整体效率,它使系统在更短的时间内传输了更多的信息。
数据压缩的起源可以追溯到信息论之父Shannon在1947年提出的香农编码。1952年Huffman提出了第一种实用性的编码算法实现了数据压缩,该算法至今仍在广泛使用。1977年以色列数学家Jacob Ziv和Abraham Lempel提出了一种全新的数据压缩编码方式,Lempel—Ziv系列算法(LZ77和LZ78,以及若干变种)凭借其简单高效等优越特性,最终成为目前主要数据压缩算法的基础。
关于数据压缩,需要了解以下几个基本概念:
(1)压缩:指的是应用数据压缩技术,除去原来文件中的冗余数据,减少存储容量并重新记录成为一个占用较小存储空间的新文件。
(2)解压缩:数据压缩的逆过程称为解压缩。解压缩指的是将压缩后的数据文件还原为压缩前的数据文件。(www.xing528.com)
(3)压缩比:指的是压缩前后的文件大小或数据量之比。压缩比是衡量压缩效率的重要指标。例如,压缩比为30∶1,则意味着原始文件大小是压缩后文件大小的30倍。
(4)有损压缩和无损质缩:数据无需进行特殊的重新组织而直接进行压缩处理,压缩后的文件经过解压缩可以完整地恢复到压缩前的文件。无损压缩是一种可逆压缩。无损压缩中,数据在压缩和解压缩过程中不会改变和损失,解压缩产生的数据是对原始数据的完整复制。当数据文件中的冗余数据很少时,使用无损压缩技术不能得到明显的压缩效果,此时,需要考虑有损压缩。为了获得更高的压缩比,需要对数据进行重新组织整理,剔除某些对用户来说不重要、不敏感或者可以忽略的原始数据,然后再进行压缩。有损压缩是不可逆的,不能完整地还原为原来的文件。有损压缩会造成一些信息的损失。但是,如果这种数据损失是在允许的范围内,则有损压缩是可接受的。有损压缩主要应用在影像节目、可视电话、视频会议等多媒体应用中。
(5)对称压缩和非对称压缩:对称压缩指的是压缩算法和解压缩算法相同的情况。对称压缩是一种可逆操作。对称压缩的最大特点在于压缩和解压缩都以同一种速度进行操作。非对称压缩指的是压缩算法和解压缩算法不相同的情况。非对称压缩是一种不可逆操作。非对称压缩的最大特点是压缩和解压缩的速度不同。例如,VCD的制作和播放是典型的非对称压缩。当制作VCD时,将一部电影压缩到VCD盘片上可能需要花费几个小时或者更多的时间;而在播放VCD时,为了视频流畅,其解压缩的速度却要求很快。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。