计算机中的信息都是用二进制编码表示的。用以表示字符的二进制编码称为字符编码。计算机中,对非数值的文字和其他符号进行处理时,要对文字和符号进行数字化处理,即用二进制编码来表示文字和符号。字符编码就是规定用怎样的二进制编码来表示文字和符号。字符编码是一个涉及世界范围内有关信息的表示、交换、处理、存储的基本问题,因此,都是以国家标准或国际标准的形式颁布施行的,如位数不等的二进制码、BCD码、ASCII码、汉字编码。
在输入过程中,系统自动将用户输入的各种数据按编码的类型转换成相应的二进制形式存入计算机存储单元中;在输出过程中,再由系统自动将二进制编码数据转换成用户可以识别的数据格式输出给用户。
1.ASCII码
ASCII码(American Standard Code for Information Interchange)是美国标准信息交换码,被国际标准化组织(ISO)指定为国际标准。ASCII码有7位码和8位码两种版本。国际通用的7位ASCII码称为ISO—646标准,用7位二进制数b6b5b4b3b2b1b0表示一个字符的编码,其编码范围从0000000B~1111111B,可以表示128个不同字符的编码。7位ASCII码表如表1-4所示,表中对大小写英文字母、阿拉伯数字、标点符号及控制符等特殊符号规定了编码,共128个字符。
表1-4 标准ASCII码字符集
(续表)
(www.xing528.com)
2.汉字编码
ASCII码只给出了英文字母、数字和标点符号的编码。为了用计算机处理汉字,同样也需要对汉字进行编码。从汉字编码的角度看,计算机对汉字信息的处理过程实际上是各种汉字编码间的转换过程。这些编码主要包括汉字输入码、汉字内码、汉字字形码、汉字地址码及汉字信息交换码等。它们的名称可能不统一,但它们表示的含义和具有的职能是明确的。下面分别对这些编码进行介绍。
(1)国标码(汉字信息交换码)。汉字信息交换码是用于汉字信息处理系统之间或者与通信系统进行信息交换的汉字代码,简称交换码,也叫国标码。它是为使系统、设备之间交换信息时采用统一的形式而制定的。我国1981年颁布了国家标准《信息交换用汉字编码字符集——基本集》,代号为GB2312-80,即国标码。
(2)机内码。汉字机内码是指在计算机内部实际用来表示汉字的代码。在不同的计算机系统实现时,实际用来表示汉字的编码会有所不同,但是它们都以国标码为转换标准,与国标码有对应关系。
目前,多数微机汉字系统的机内码都是以国标码规定的代码为依据的,经转换后用两个字节表示一个汉字。每个字节的最高位均为1,以此作为汉字的标记,以便与ASCII码编码的符号相区别。
(3)汉字输入码。汉字输入码是为了将汉字通过键盘输入计算机而设计的代码。汉字输入编码方案很多,其表示形式大多为字母、数字或符号。输入码的长度也不同,多数为4个字节。
(4)汉字字形码。汉字字形码是指汉字字库中存储的汉字字形的数字化信息。目前,汉字信息处理系统中产生汉字字形的方式大多是数字式的,即以点阵的方式形成汉字。因此,汉字字形码主要是指汉字字形点阵的代码。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。