首页 理论教育 认识ASCII码和汉字编码

认识ASCII码和汉字编码

时间:2023-11-17 理论教育 版权反馈
【摘要】:ASCII 码分为基本ASCII 码和扩充ASCII 码。通常有4 种类型的编码,即输入码、国际码、内码和字形码。国标码国标码又称为汉字交换码,用于在计算机之间交换信息。

认识ASCII码和汉字编码

1.ASCII 码

ASCII 码即美国标准信息交换码,被国际标准化组织(ISO)定为国际标准,是计算机系统使用最广泛的字符编码。

ASCII 码分为基本ASCII 码和扩充ASCII 码。

2.汉字编码

西文是拼音文字,基本符号比较少,编码比较容易。因此,在一个计算机系统中,输入、内部处理、存储和输出都可以使用统一代码。汉字种类繁多,编码比拼音文字困难,因此在不同的场合要使用不同的编码。通常有4 种类型的编码,即输入码、国际码、内码和字形码。

(1)输入码

输入码所要解决的问题是如何使用西文标准键盘把汉字输入到计算机内。有各种不同的输入码,主要可以分为四类:顺序码、音码、形码和音形码。

①顺序码:用数字串代表一个汉字,常用的是国际区位码。它将国家标准局公布的6763 个两级汉字分为94 个区,每个区分为94 位。

②音码:以汉字读音为基础的输入方法。由于汉字同音太多,从而重码率高,但易学易用。

③形码:以汉字的形状确定编码,即按汉字的笔画部件用字母或数字进行编码。如五笔字型、字形码,便属于此类编码。其难点在于如何拆分一个汉字。

④音形码:结合音码和形码的优点,同时考虑汉字的读音和字形进行编码。

(2)国标码

国标码又称为汉字交换码,用于在计算机之间交换信息。用两个字节来表示,每个字节的最高位均为0。将汉字区位码的高位字节、低位字节各加十进制数32(即十六进制数的20),便得到国标码。这就是国家标准局规定的GB 2312—1980 信息交换用汉字编码集。

(3)机内码

机内码是在设备和信息处理系统内部存储、处理、传输汉字用的代码。

(4)字形码(www.xing528.com)

字形码表示汉字字形的字模数据,因此也称为字模码,是汉字的输出形式。通常用点阵、矢量函数等表示。从汉字代码转换的角度,一般可以把字节信息处理系统抽象为一个结构模型,如下所示:

汉字输入→输入码→国标码→机内码→字形码→汉字输入

汉字的内码=汉字的国标码+8080H,区位码的十六进制表示+2020H=国标码。

选择题

1.在符号数表示中,采用二进制的原因不包括( )。

A.可降低硬件成本 B.两个状态的系统具有稳定性

C.二进制的运算法则简单 D.合乎人们的习惯

2.一个字长为6 位的无符号二进制数能表示的十进制数值范围是( )。

A.0~64 B.1~64 C.1~63 D.0~63

3.无符号二进制整数1001001 转换成十进制数是( )。

A.72 B.71 C.75 D.73

4.十进制数32 转换成无符号二进制整数是( )。

A.100000 B.100100 C.100010 D.101000

5.一个字符的标准ASCII 码的长度是( )。

A.7b B.8b C.16b D.6b

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈