首页 理论教育 文本压缩方法及效果-计算机网络原理

文本压缩方法及效果-计算机网络原理

时间:2023-11-17 理论教育 版权反馈
【摘要】:另一种表示服务也是对数据进行变换,但它是以减少通信量、减少传输费用为目的,这就是文本压缩。文本的压缩有许多方法,下面简单地介绍几种。例如北京可表示为000,000,010等等。这样,一个县市名的平均长度从12位压缩到为6×0.9+12×0.1=6.6位,即压缩了45%.例如我国的长途自动电话的区号编码即为Huffman编码,北京的编码长1位,上海等其它几个大城市的编码长2位,长沙等城市的编码长3位,其它小城市及县乡的编码长4位。

文本压缩方法及效果-计算机网络原理

数据保密是一种对数据进行变换以安全传输数据的表示服务。另一种表示服务也是对数据进行变换,但它是以减少通信量、减少传输费用为目的,这就是文本压缩。

在通信能力十分紧张的情况下,压缩传输的文本可缓解对通信能力的要求。随着网络通信能力的增加,这种要求会有所缓和。但人与人,计算机与计算机之间的信息交换量总是不断地增加,因此,压缩传输的文本仍有其现实的意义。

文本的压缩有许多方法,下面简单地介绍几种。

1、缩写法

最常见的压缩方法是缩写法,如“国防科学技术大学”缩写为“国防科大”,Operating System缩写为OS,DataBase缩写为DB等。单词亦可缩写,如Department缩写为Dept,Corperation缩写为Corp等。

2、代换法(www.xing528.com)

代换法即用一种较为简短的表示方法代替另一种较为复杂的表示方法,如“系统工程与数学系信息系统工程教研室”可以用“703教研室”代替,“系统工程与数学系信息系统工程专业一班”可用“721班”代替等。

3、Huffman编码法

字符相对使用频率相差很大的情况下,可使用Huffman编码法。其基本思想是使使用频率越高的字符编码越短,这样,传输的报文长度就会缩短。中国的县市各有2000多个,当不考虑它们在通信环境中的使用频率时,可用12位二进制序列表示它们。例如北京可表示为000,000,010等等。现假定在某种应用中,有64个大城市的使用频率总和为0.90,因此可采用6位的短码表示大城市名,而用12位的长码表示其它县市名。这样,一个县市名的平均长度从12位压缩到为6×0.9+12×0.1=6.6位,即压缩了45%.例如我国的长途自动电话的区号编码即为Huffman编码,北京的编码长1位,上海等其它几个大城市的编码长2位,长沙等城市的编码长3位,其它小城市及县乡的编码长4位。

还有许多其它的压缩的方法,有兴趣者可以参阅其它书籍

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈