1.计算机中数据的单位
(1)位(bit)。
位简记为b,也称为比特,是计算机存储数据的最小单位。
(2)字节(Byte)。
字节简记为B。规定8 bit=1 B。字节是存储信息的基本单位。微型计算机存储器是由一个个存储单元构成的,每个存储单元的大小就是一个字节,所以存储容量大小也以字节数来度量。常用到的其他度量单位有KB、MB、GB、TB、PB、EB、ZB、YB,其换算关系为:
1 KB=210B,1 MB=210KB=220B,1 GB=210MB=230B,1 TB=210GB=240B,
1 PB=210TB=250B,1 EB=210PB=260B,1 ZB=210EB=270B,1 YB=210ZB=280B
2.数值的表示
在计算机中,所有数据都以二进制的形式表示。数的正负号也用“0”和“1”表示。通常规定一个数的最高位作为符号位,“0”表示正,“1”表示负。把在机器内存放的正负号数码化后的数称为机器数;机器数可以用不同的码制来表示,常用的有原码、反码、补码表示法,其中正数的原码、反码、补码是它本身,而负数的原码、反码和补码如下描述:
(1)负数原码:负数的原码是它本身。
(2)负数反码:最高符号位不变,其他位按位取反。
(3)负数补码:负数反码的基础上末位加1。
3.西文字符的编码
微型计算机中常用的字符(西文字符)编码是ASCII码,它是American Standard Code for Information Interchange(美国标准信息交换代码)的缩写,已被国际标准化组织ISO采纳,作为国际通用的信息交换标准代码。ASCII码是一种西文机内码,有7位ASCII码(标准ASCII码)和8位ASCII码(扩展ASCII码)两种。7位标准ASCII码用一个字节(8位)表示一个字符,并规定其最高位为0,实际只用到7位,因此可表示128个不同字符,其中控制字符34个、阿拉伯数字10个、大小写英文字母52个、各种标点符号和运算符号32个。比较字符的大小其实就是比较字符ASCII码值的大小。一般来说,ASCII码值的大小规律为:可见控制符号<数字<大写字母<小写字母。
4.汉字信息编码(www.xing528.com)
(1)汉字信息交换码(国标码)。
1980年,我国颁布了第一个汉字编码字符集标准,即GB 2312—1980《信息交换用汉字编码字符集基本集》,该标准编码简称国标码,是我国大陆地区及新加坡等海外华语区通用的汉字交换码,奠定了中文信息处理的基础。
(2)汉字输入码。
将汉字通过键盘输入计算机采用的代码称为汉字输入码,也称为汉字外部码(外码)。汉字输入码的编码原则应该易于接受、学习、记忆和掌握,码长尽可能短。根据编码规则,汉字输入码可分为:
1)音码:以汉语拼音字母和数字为汉字编码,例如搜狗拼音输入法。
2)音形码:以拼音为主,辅以字形字义进行编码,例如自然码输入法。
3)形码:根据汉字的字形结构对汉字进行编码,例如五笔字型输入法。
4)数字码:直接用固定位数的数字给汉字编码,例如区位输入法。
(3)汉字机内码。
汉字机内码是在计算机内部对汉字进行处理、存储和传输而编制的汉字编码,应能满足存储、处理和传输的要求,不论用何种输入码,输入的汉字在机器内部都要转换成统一的汉字机内码,然后才能在机器内传输、处理。
(4)汉字地址码。
汉字地址码是指汉字库(这里主要指整字形的点阵式字模库)中存储汉字字形信息的逻辑地址码。汉字库中,字形信息都是按一定顺序(大多数按标准汉字交换码中汉字的排列顺序)连续存放在存储介质上,所以,汉字地址码也大多是连续有序的,而且与汉字内码间有着简单的对应关系,以简化汉字内码到汉字地址码的转换。
(5)汉字字形码。
汉字字形码是用来将汉字显示到屏幕上或打印到纸上所需要的图形数据。汉字字形码记录汉字的外形,是汉字的输出形式。记录汉字字形通常有两种方法:点阵法和矢量法,分别对应两种字形编码:点阵码和矢量码。所有的不同字体、字号的汉字字形构成汉字库。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。