五笔字型中文输入法是国内应用最广泛的输入法之一,是专业文字录入人员的首选。具有直观、重码率低、输入速度快等优点。下面介绍五笔字型的编码原理和输入方法。
1.汉字结构
五笔字型编码思想是将汉字从组成结构上分为三个层次:笔画、字根和单个汉字。
(1)汉字的笔画
在汉字中,一个“笔画”就是一个汉字在连续书写不间断的线条。五笔字型输入法中把“笔画”分为5种。如表2-1所示。
表2-1 汉字的5种基本笔画
在判断笔画时,主要以运笔方向作为判断笔画的依据。
(2)汉字的字根
五笔字型的“字根”是由笔画或笔画复合连线交叉而形成的一些相对不变的结构,用来作为组字的固定成分。五笔字型中大多数字根是传统汉字中的偏旁部首。如:彳、亻、氵等。共有130个字根。
(3)汉字的结构
字根按照一定的方式组成汉字,五笔字型根据汉字的各字根之间的相对位置关系,把汉字分为3种类型:左右型、上下型和杂合型。
左右结构:可以把汉字分成左右两部分或左中右三部分。如:林、树、治。
上下结构:可以把汉字分成上下两部分或上中下若干部分组成。如:是、字、晶。
杂合结构:既不能把汉字分成左右结构也不能分成上下结构。主要是半包围或全包围结构、独体字。如:匡、凶、圆、我等。
2.汉字的拆分
(1)字根结构
字根是五笔字型的基本单位,字根结构可以分为单、散、连、交4种。
1)单字根结构:字根本身就是一个独立的汉字。如:门、口、人、竹等。
2)散字根结构:汉字是由多个字根按左右或上下结构构成,字根之间保持一定的距离。如:汉、阳、森等。
3)连字根结构:单笔画与某一些基本字根相连或带点的结构组成的汉字。如:且、于、玉等。
4)交字根结构:两个或多个以上字根相互交叉、重叠在一起。如夫、果等。
(2)汉字的拆分原则
使用五笔字型输入汉字时,首先把汉字拆分为字根。拆分原则如下:
1)取大优先:当汉字按顺序可拆成多个字根时,拆在前面的字根笔画应该尽可能最大。
如:夫:一 大(错误) 二 人(正确)
2)兼顾直观:在拆分汉字时也要考虑汉字的整体性。
如:国 冂 王 丶 一(错误) 囗 王 丶(正确)
3)能连不交:当一个汉字拆开的多个字根是能连在一起的字根,就不要拆分成多个字根交叉在一起。
如:丑 刀 二(错误) 乙 土(正确)
4)能散不连:当一个汉字拆分的字根能连在一起作为一个整体,就不要拆成多个连在一起的字根。
如:自 亻 乙 三(错误) 丿 目(正确)
(3)字根表
五笔字型输入法共规定有130个字根分布在25个英文字母键上。基本分配方法是,按字根笔画的形式划分为五个区,每个区对应5个英文字母,每个键叫一个位。区和位都给予从1到5的编号,叫区、位号。具体分区如图2.76所示。
图2.76 五笔字型字根表(www.xing528.com)
(4)单字的编码规则
1)键名汉字编码。在字根表中,每个键的第1个字根叫键名汉字,它们是一组使用频率最高的字根。其输入法是把所在键连击4下。如:王:王王王王 11 11 11 11(GGGG)
日:日日日日 22 22 22 22(JJJJ) 2)成字字根编码。在字根中,除了键名汉字以外,有些字根本身也是汉字,这样的字根称“成字根”,其编码为:首先打一下它所在的键(称“报户口”),再加打它的第一个单笔画、第二个单笔画及最后一个单笔画,不足4键的加打一个空格键。
如:竹:竹 丿 一 丨TTGH
车:车一乙丨LGNH 3)键外字编码。键外字指“字根总表”上没有的汉字。根据其拆分的字根多少分为两类:一类是拆分的字根有4个及以上的汉字,其编码为:取其一、二、三、末共四个字根的码组成输入码。
如:戆:立 早 夂 心 UJTN
照:日刀口灬JVKO当一个字拆分不够4个字根时,首先按拆分顺序输入相应的字根的码,再追加一个“末笔字型识别码”,简称“识别码”。识别码由汉字的最后一笔笔画的类型编号和汉字的字型编号组成,如下表:
表2-2 末笔字型识别码表
3.简码输入
汉字中有些汉字使用频率较高。为了提高效率,节省时间,五笔字型规定了简码。在对这些简码输入时,可以减少击键次数并降低拆字难度。五笔字型共有三级简码,分:一级简码、二级简码和三级简码。
(1)一级简码
一级简码的输入方法是:按一次字根键后再加打一个空格键即可。一级简码表如下:
表2-3 五笔字型一级简码表
(2)二级简码
二级简码的编码方法是:输入本字的单字编码的前二码,再加打空格键。
二级简码的个数较多,理论上应该有25×25= 625个,实际上只有600个左右。如:春、物、淡等。
(3)三级简码
三级简码的编码方法是:输入本字的单字编码的前三码,再加打空格键。理论上应该有25×25×25= 15 625个,实际上没有那么多。
(4)词语输入
词语的输入可大大提高五笔字型的输入速度。词语的输入与单字输入一样,不管词语多长,都只取4码。其编码方法如下:
1)两字词:每字取其全码的前两码组成,共四码。
如:经济:纟 又 氵 文 (XCIY)
操作:扌 口 亻 竹 (RKWT)
2)三字词:前两字各取一码,最后一字取前两码,共四码。
如:计算机:讠 竹 木 几 YTSM
操作员:扌亻口贝RWKM
3)四字词:每字各取全码的第一码。
如:科学技术:禾 氵 扌 木 TIRS
五笔字型:一 竹 宀 一 GTPG
4)多字词:取第一、二、三及末一个汉字的第一码,共四码。
如:中华人民共和国:口 亻 人 囗KWWL
电子计算机: 日 子 言 木 JBYS
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。