首页 理论教育 计算机数据处理:大学计算机基础教程

计算机数据处理:大学计算机基础教程

时间:2023-11-23 理论教育 版权反馈
【摘要】:信息表示是计算机科学中的基础理论。计算机中的信息分为数值信息和非数值信息。计算机中的信息都是由0和1构成的二进制代码表示。表2.1.2为常用的存储单位。常用进制及其表示方法见表2.1.3。十进制数、二进制数、八进制数和十六进制数的相互转换见表2.1.4。A.255B.256C.128D.127D本题考查的是进制之间的换算关系,7位二进制数表示的最大无符号整数为1111111,换算成十进制数为127。

计算机数据处理:大学计算机基础教程

▶考点1:计算机中数据的表示与存储

1.计算机中的数制

信息既不是物质,也不是能量,它是指事物运动的状态及状态变化的方式;信息是认识主体所感知或所表达的事物运动及其变化方式的形式、内容和效用;信息是人们认识世界和改造世界的一种资源。

信息处理过程是指信息的收集、加工、存储、传递及使用过程。信息技术(Information Technology,IT)是指用来扩展人们的信息器官功能并协助人们更有效地进行信息处理的一类技术。信息表示是计算机科学中的基础理论。计算机中的信息分为数值信息和非数值信息。计算机中的信息都是由0和1构成的进制码表示。计算机领域中涉及的数制有4种:二进制(Binary,B)、八进制(Octal,0)、十进制(Decimal,D)和十六进制(Hexadecimal,H)。

2.计算机中的信息存储单位

(1)位(bit)

位是计算机中度量数据的最小单位。代码只有0和1,无论0还是1在CPU中都是1位。

(2)字节(Byte)

一个字节由8个位组成,是表示存储容量的基本单位,简写为“B”,即1 B=8 bit。在计算机中可以用一个字节来表示一个数字、英文字母和一些其他特殊符号

计算机内部为了便于衡量存储器的大小,统一以字节(Byte,简写B)为单位。表2.1.2为常用的存储单位。

表2.1.2 常用的存储单位

提示:该考点经常出现在考查存储单位大小关系的题目中,需要掌握各个单位之间的换算。

【经典习题1】在下列关于“计算机采用二进制的原因”的说法中,不正确的是( )。

A.符合逻辑运算 B.物理上容易实现

C.人们习惯用二进制表示数 D.运算规则简单

【答案】C

【解析】本题考查的是二进制的基本概念。只有计算机内部采用二进制,而人们在生活中习惯使用十进制。

【经典习题2】1 MB的准确值是( )。

A.1024×1024 bit B.1024 KB C.1024 MB D.1000×1000 KB

【答案】B

【解析】本题考查的是存储单位之间的换算关系:1 MB=1024 KB=1024×1024 B=1024×1024×8 bit。

▶考点2:常见数制及其转换

1.进位计数制

所谓进位计数制,就是人们通常说的进制或数制,是指用一组固定的数字和一套统一的规则来表示数目的方法。在日常生活中最常用的是十进制数,其进位、借位的规则是“逢十进一、借一当十”,它用0、1、2、3、4、5、6、7、8、9共10个计数符号表示数的大小,这些符号称为数码,全部数码的个数称为基数(十进制的基数是10),不同的位置有各自的位权。例如,十进制数个位的位权是100,十位的位权是101,百位的位权是102

常用的进制有二进制、八进制、十进制和十六进制,有时为了表达方便,常常在数字后面加上一个字母后缀,表示不同进制的数,有时也用在括号右下角添加下标数字的形式表示某种进制。常用进制及其表示方法见表2.1.3。

表2.1.3 常用进制及其表示方法

2.常用数制之间的转换

(1)十进制数转换为二进制数

整数部分的转换与小数部分的转换要分别进行,然后再组合。

①十进制整数转换为二进制、八进制、十六进制整数。

如果把二进制、八进制、十六进制统称为R进制,十进制整数转换成R进制数的方法是采用“除R取余”法。例如,将十进制数转换成二进制数的方法是“除2取余”法,即反复除以2直到商为0,每次相除得到的余数就是新得二进制数的每一位数。先得到的余数是新得二进制数的低位数,后得到的是新得二进制数的高位数。

②十进制小数转换为二进制小数。

十进制小数转换成二进制小数采用“乘2取整”法,即反复乘以2取整数,直到小数为0或达到精度要求为止,先得到的整数为新得二进制小数的高位数,后得到的整数为新得二进制小数的低位数。

(2)二进制、八进制、十六进制数转换为十进制数

二进制数、八进制数和十六进制数转换为所对应的十进制数,采用“按权展开求和”的方法。

(3)二进制数与八进制数、十六进制数的相互转换

①二进制数转换成八进制数。

二进制数转换成八进制数的方法:以小数点为起点,整数部分从右至左,每3位一组,不足3位时,在高位补0;小数部分从左至右,每3位一组,不足3位时,在低位补0,每组对应一位八进制数。

反之,八进制数转换为二进制数的方法是八进制数的每一位对应二进制数的3位。

②二进制数转换成十六进制数。

二进制数转换成十六进制数的方法:以小数点为起点,整数部分从右至左,每4位一组,不足4位时,在高位补0;小数部分从左至右,每4位一组,不足4位时,在低位补0,每组对应一位十六进制数。

反之,十六进制数转换为二进制数的方法是十六进制数的一位对应二进制数的4位。

十进制数、二进制数、八进制数和十六进制数的相互转换见表2.1.4。

表2.1.4 各种进制数码对照表

提示:考生遇见进制之间的换算题,特别是八进制、十六进制还有十进制之间的换算的时候,都尽量先把它们转换成二进制再进行换算,这样出错的概率最低。

【经典习题1】用7位二进制数能表示的最大无符号整数等于十进制整数( )。

A.255 B.256 C.128 D.127(www.xing528.com)

【答案】D

【解析】本题考查的是进制之间的换算关系,7位二进制数表示的最大无符号整数为1111111,换算成十进制数为127。

【经典习题2】十进制数101转换成无符号二进制整数是( )。

A.0110101 B.01101000 C.01100101 D.01100110

【答案】C

【解析】本题考查的是进制之间的换算关系,考生要熟记十进制转换二进制的方法,就是“除2取余”。

【经典习题3】如果在一个非零无符号二进制数的尾部增加两个0,则此数的值为原数的( )。

A.4倍 B.2倍 C.1/2 D.1/4

【答案】A

【解析】本题考查的是进制之间的换算关系,后面增加两个0,代表数字增加4倍。

【经典习题4】下列数值最大的是( )。

A.111011B B.80D C.7AH D.1020

【答案】C

【解析】本题考查的是进制之间的换算关系,应把所有进制的数换算成同一进制的数进行比较。

▶考点3:西文字符的编码

在计算机内部,除了数值信息外,还有其他信息,如文字、声音、图形、图像、动画、视频等非数值信息。这些非数值信息在计算机内也是采用0和1两个符号来进行编码和表示的。常见的字符编码有ASCII码和EBCDIC码。

ASCII码是美国标准信息交换码的简称,是目前国际上最为流行的字符信息编码方案。标准的ASCII码是用7位二进制位表示数据信息,最多可表示27(128)个不同的符号,包括0~9共10个数字、52个大小写英文字母、32个标点符号和运算符以及34种控制字符,如回车、换行等。例如,数字“0—9”的ASCII编码值为“48—57,大写字母“A—Z”的ASCII编码值为“65—90”,小写字母“a—z”的ASCII编码值为“97—122。数字、大写字母、小写字母的ASCII编码值是连续的。

标准ASCII编码只采用7位二进制位,并没有用到字节的最高位。为了方便计算机处理和信息编码的扩充,人们一般将标准ASCII码的最高位前增加一位0,凑成一个字节,即8位二进制位,以便于存储和处理,这就是扩展的ASCII码。在计算机系统中,通常利用这个字节的最高位作为校验码,以便提高字符信息传输的可靠性

【经典习题1】在ASCII码表中,按照ASCII码值从小到大的排列顺序是( )。

A.数字、英文大写字母、英文小写字母 B.数字、英文小写字母、英文大写字母

C.英文大写字母、英文小写字母、数字 D.英文小写字母、英文大写字母、数字

【答案】A

【解析】本题考查的是在ASCII编码中,数字字符、英文字母的ASCII值的排列顺序,顺序为英文小写字母>英文大写字母>数字字符。

【经典习题2】字符C的ASCII码为1000011,则字符E的ASCII码为( )。

A.1000100 B.1000101 C.1000111 D.1001010

【答案】C

【解析】C的ASCII码为1000011,E与C相差2,转换为二进制是101000011+10=1000101。

▶考点4:汉字的编码

计算机只识别由0、1组成的编码,而对于常用的汉字,计算机是不能直接识别的。为了使计算机更好地处理汉字信息,需要对每个汉字进行编码。由于汉字的数量远大于128,所以在计算机内部存储汉字时,使用16位二进制位即两个字节来表示一个汉字。这样就可以对216=65536个汉字进行编码。汉字常用的编码技术有国标码、机内码和区位码。

(1)国标码

我国国家标准局于1981年5月颁布了《信息交换用汉字编码字符集——基本集》,国家标准代号为GB 2312—80,习惯上称为国标码。其共对6763个汉字和682个图形字符进行了编码,其编码原则是两个字节表示一个汉字,每个字节用七位码,该字节的最高位为0。

(2)机内码

为了避免ASCII码和国标码同时使用时产生二义性问题,大部分汉字系统都采用将国标码两个字节最高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。例如,假设一个汉字的国标码为0101 0000 0110 0011,即5063H,而按机内码组成规则该汉字的机内码为1101 0000 1110 0011,即DOE3H,两者刚好相差8080H。换句话说,机内码=国标码+8080H

(3)区位码

将GB 2312—80的全部字符集排列在一个94行×94列的二维代码表中,每两个字节分别用两位十进制编码,前字节的编码称为区码,后字节的编码称为位码,此即区位码。

(4)字形码

字形码是点阵代码的一种。为了将汉字在显示器或打印机上输出,把汉字按图形符号设计成点阵图,就得到了相应的点阵代码(字形码)。

显示一个汉字一般采用16×16点阵或24×24点阵或48×48点阵。已知汉字点阵的大小,可以计算出存储一个汉字所需占用的字节空间。

提示:

区位码=国标码-2020H;

机内码=区位码+AOAOH。

【经典习题1】一个汉字的机内码需用两个字节存储,其每个字节的最高二进制位的值分别为( )。

A.0,0 B.1,0 C.0,1 D.1,1

【答案】D

【解析】本题考查的是机内码的概念,机内码的每个字节最高位恒为1。

【经典习题2】存储1024个24×24点阵的汉字字形码需要的字节数是( )。

A.720 B B.72 KB C.7000 B D.7200 B

【答案】B

【解析】本题考查的是字形码的概念,已知汉字点阵的大小,可以计算出存储一个汉字所需占用的字节空间。1024×24×24/8=72×1024 B=72 KB。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈