检字的方法,在使用字母的国家,虽绝对无问题,而在我国却是一个大问题,和读书的便利,时间的经济,均有密切关系。一因字典词典系帮助读书的工具,所以检字方法的难易,就成为读书难易的一个重大原因;一因图书片目人名录商业名簿电话簿及其他种种索引,都是按字检查的,所以检字方法的难易也就影响及于时间的经济。
汉字检查的方法,现在最流行的就是《康熙字典》的部首法。这些部首一共二百十四个,以三四万字而论,平均每部不下二百字,而最大的部且十倍于这数;例如草部容有一九五六字,水部一六四五字,手部一三二二字,口部一二四六字,故分部之后,不能不再分笔画;然而较大的部中,同笔的字也往往在百个以上,即如草部的八画共二〇五字,九画共二〇四字。照这样检查起来,已经是万分的困难了。何况部首的界限极不分明,往往表面上应属于甲部的字,实际上却属于乙部,即如“夜”字不属于亠部而属夕部,“滕”字不属月部而属水部,“禽”字不属人部而属禸部等例,不胜枚举。又如“求”字属水部,“承”字属手部,“危”字属卩部,“者”字属老部,“年”字属干部,“衆”字属目部等,尤无从捉摸。至笔画一项,何者应连为一笔,何者应分为二笔,也没有一定的规则。好不容易找到了部首,仍须在百数个同笔的字中乱找一遍。如果找不着,就要在多一笔或少一笔里试找。如果仍找不着,只好向另一部里再找。照此找来找去,不知费了多少时候,才侥幸找得着所欲找的字。这不是绝大的困难吗?
日本所出的字书,其编列次第,却和《康熙字典》相反,大概先分笔画,后分部首。我国近也仿行,然而通常所用一万字上下的字典中,同一笔画的字,竟有多至一千的;而且计算笔画也时有异同,如臣字宋体作六画,楷体则作七画。在八千字上下的一副铅字中,有这样问题的字不下一千二百个。因此仍然免不了种种的困难。
我国新出版的字典,如商务印书馆的新字典等,于分部分画仍照字典旧例之外,往往于书前另编检字一卷,对于部首稍有疑惑的字,都按照笔画,顺序排列,每字之下,又注明页数以便检查。这方法虽可补救分部的缺点;然而检字表中七画至十二画每画所容的字,均在二三百以上,检查时仍不免大费工夫。
近顷所谓国音字典,则按照国音排列,似乎无甚例外。但目前距离国音普及之期尚远,即令此为最完善之方法,仍不是人人所能使用。何况我国文字都是单音的,纵然可以用字母缀音,同音的字必定很多,检查上仍是很不便利呢。
海通以来,西人学习汉文者颇多,深感汉字检查的困难,故利用科学的方法,殚精研究,建议了许多种的改革。最近十数年间,国人方面也深知改造字典排列方法的必要,从事于此项研究者不乏其人。兹分别举其主张概略于下:
(1)加勒尔氏(T.M.Callery),法兰西人,于一八四一年以法文著有《中国音韵检字法》(Systema Phoneticum Scripturae Sinicae),又于一八四四年著《中国语文辞典》(Dietionaire Encyclopedêque de la Langue Chinoise),主张按各字的首笔排列,但他自己对于这方法,并没有彻底的实行。他所著的辞典也是按照音符排列的;那同音的字再按着笔画多少顺序排列。按加氏虽有种种新意见,为外人主张改革我国检字法的先导,然其研究固未成熟也。
(2)华胥留氏(W.P.Wassiliew),俄人,著有《中俄字典》(一八四四年出版)及《中国文字之分析》(Analysis of the Chinese Characters)(一八九八年出版)两书。主张按各字的右旁或最低或最显著的笔画而排列。这主张却很有研究的价值。不过他的《中俄字典》还是先按音符排列,那同音符的字才按着右旁或最显著的部分排列;至他所分的母笔还没有根据一定的原理,而于各笔怎样结合的规则也没有说明。因此他的主张也只可算为一种研究的先驱,不能认为成熟。
(3)普勒特氏(P.Poletti)著有《中英字典》一书,其检字方法,系于按旧法检到部首之后,将剩余的部分再按部首或小部首顺序检查,好像西文找到第一字母之后再找第二字母一般,因此就用不着计算笔画了。这固然也是一种新颖的方法,不过对于旧法检查部首的困难仍然没有减少,而且剩余的部分未必一一都合乎部首,故检查上仍有许多不规则之处。
(4)鲁森堡氏(O.Rosenberg)俄人,研究汉字排列法极精,于一九一六年在日本出版有《五段排列汉字典》一书。其检字法先取五种方向的“一”“丨”“丿”各母笔为基础,再演为二十四子笔,更进而演为五百六十七个字母;这五百六十七个字母,分列六十栏。检字时先看右旁最低一笔系属何种母笔,再由母笔推定其属何种子笔,又从该子笔项下查明此字属于那一个字母;然后按照这字母栏下所列的栏数,向字典本部中检得该栏和该字母。至于同字母的许多字,则按照字体结构的情形而排列,计将各字体分为三种,一为单纯字体,如“立”字等;二为左右相连字体,如“泣”字等;三为上下相连字体,如“笠”字等;其顺序先单纯字,次左右相连字;再次为上下相连字;而同一顺序的字,则就其首笔依五种方向的先后分别排列。这方法分析很为精细,是其长处;但由母笔找子笔,由子笔找字母,由字母之栏数找字典中特定的部分,再由特定的部分按照字体结构找所欲找的字——先后计分四层手续,就中尤以最后一层手续为最困难,因每栏不止一字母,而每字母所含的字往往多至百数十个,费时既多,而且程度很浅或是年纪很小的学生,都不容易明白。所以我认为它还没有解决检字方法的难题呢。
(5)高梦旦氏十数年前有改革部首之草案;其方法但管字形,不管字义,将旧字典二百十四部,就形式相近者并为八十部,并确定上下左右之部居;此法自然较旧法为便利,但高氏自以为不彻底,故至今未曾发表。
(6)林玉堂氏研究部首不下十年,初时就首笔着手,将笔法分做五母笔及二十八子笔;譬如欲检“鲤”字先检“”于部首中,即得鱼部,再从鱼部中检“冂”则得“鲤”字。此法特殊处,在以察看首笔代计算笔画,检查上确较旧法便捷。近来林君又将其多年研究的首笔抛弃,另行研究末笔,实际上进步不少;现已将次完成,不日由商务印书馆印刷成书发表,此处不更多述。
(7)黄希声氏将汉字分析而成字母,凡二十种,既认此二十字母与外国文的字母相同,谓英文的m a n三个字母合而为man“人”字,犹汉文之一撇一捺合而为“人”字一样。这方法虽很新颖,但恐不易实行。因为西文皆由左而右,毫无疑义;汉文则每字笔画,有上下左右交离接分之种种不同,纵勉强把笔画顺序来比附,然既须逐笔比较,则每笔的顺序都要彻底明白才好,这断不是初学的人办得到的。况且西文检字只须记得字母的顺序如month(月)字的month五字母,便已尽其能事;而汉文检字,则对于“月”这个字,断非仅仅记得“丿”“”“一”“一”四个字母而已足,却还要注意每笔的位置而后可。有了这样复杂情形,实行上自然不及西文之便利。
(8)何公敢氏对于检字方法,也有长期而细密的研究。他也是从首笔进行;但所走的是另一条路,与林氏绝不相同;具体的办法,不日可以公表,此处亦不详述。
此外研究汉字排列法者尚多;或者他们的方法,我还没有知道,或者他们的方法和上列这几种大同小异。因此我就不能多举其例了。
总之,上述各方法,互有短长,颇难遽行断定;至于我的理想中的汉字排列法,则必须合乎下列几个原则:
(一)人人都能明白;
(二)检查迅速;
(三)必须一检便得,不要转了许多弯曲;
(四)不必知道笔顺;
(五)每字的排列有一种当然的次序,不必靠索引上所注的页数或其他武断的号码,便能检查;
(六)不可有繁琐的规则;
(七)每字有一定的地位,绝无变动;
(八)无论如何疑难之字必能检得。
我对于这新检字方法的研究,始于民国十三年十一月。我的研究出发点就是一本电码书。我觉得翻电报的人由文字翻译电码,第一,须决定该字属于何部;第二,须从画数中找出该部首;第三,须从部首表中所注该部的页数检得该部;第四,须从同部许多字中,按照笔画的多少,检查所欲检的字。其手续麻烦,费时长久,和《康熙字典》相同。至于收电报一方面的人,由电码检取文字,只须按照号码的大小,一检便得;其速率和便利,胜于由文字翻电码者不下十倍。因此我就起了一个念头,以为假使每字各有一个当然的号码,和电码书一般,排成字典或词典时,检查上真是万分的迅速便利啊!不过电报号码都是武断的规定;为什么这个字要用这号码,那个字要用那号码,绝对没有一定的标准。所以电报局里专门译电的人,为求迅速故,须得把电码书中的七八千个字,每字四个号数,一一熟读,牢记在脑筋里。我们试想一下,这是多么艰难的一件事呢?至于寻常人之由文字翻译电码,只有仍照《康熙字典》的检字法;所以表面上每字虽有一个号码,对于发电报的人却没有一点的便利啊。
我的思路到了这里,自然而然起了一种幻想——就是想发明一种方法,使每字都可推算得一个号码,只要明白这个方法,则千千万万字的号码,都可以从理解中推算出来,绝对用不着熟读,绝对用不着记忆。这样一来,那找字典词典的人,都好像收到了一封电报,从号码找寻文字一样的迅速便利。当我作此幻想的时候,曾经向家人和几个朋友说过,他们都持着怀疑的态度,以为这恐怕是一个空中楼阁罢了。就是我自己也不敢必其有成,不过姑妄为之而已。
曾几何时,这幻想竟成为事实。我自从起了这幻想,就先用科学的方法,把各种形体的字归纳起来,又分析起来,想从其中找出一把钥匙,可以开放这个几千年的大秘密。可是越想越觉其难,好几次要把这问题抛弃了。
有一天,我的幻想忽然发现一线的光明。我方在食饭的时候,忽然想起,平时我们计算字的笔画,系将各种笔画一起计算,所以每字只有最多不过两位的一数;但是笔画的种类很多,假使分别计算,则每字可有几种的笔画数量。譬如“天”字,合计起来,共得四笔,分计起来,却成为二横一撇和一捺,那岂不是有三个单位的数吗?我想到这里,不觉把桌子一拍,大笑起来,家人见这情形,不知就里,竟以为我要发狂,殊不知我的新检字法就在这时候开端了。
我的幻想从此有了着落,便日日依此范围研究,不多时便得了一个具体的方法。现在简单说明如下:
“向来计算笔画,系将各种笔画一起计算,计开笔画最少者为一画的‘一’字,最多者为三十五画的‘齾’字;譬如一万字的字典里,若按三十五画分别排列起来,则每一画所容的字平均不下三百个,但十七八画以下和四五画以上的字数寥寥无几,因此那九,十,十一,十二等画中,每画所容的字数,自然要多到七八百以上了。”
现在我把笔法粗分做五类,第一类就是横和趯;第二类就是直和直钩;第三类就是撇;第四类就是点和捺;第五类就是各种的屈折。
每类笔法的数目,各用一个数目来表示,依序排列。
欲检某字时,先计算这字所含的横笔和上趯共多少,就把其数目记在第一位,次计算直和直钩共多少,把其数目记在第二位;此外三类笔法也照样计算,依序记数。如有某类笔法全缺的,就记上一个“0”数;又如有某类笔法超过9数的,只记上一个9数。兹列表于下:
依这方法,每字都有一定的号码,按号码顺序,于字典中检字,都有一定不易的地位。
我依这方法,将常用的字一万多个排列起来,计共得五千九百八十余个号码,平均每一号码只容有两个字。
这方法,我称他为号码检字法,就是最初用有意义的号码来检字的方法。他的确是简单易学,无论何人,只需一二分钟的训练,便能懂得。(www.xing528.com)
许多人现在听得这方法,恐怕和我当时的情形一般,认为十分美满,从此以后,检字法便没有问题了。但是遇着笔画较多的字像“鬱”“瀨”等字,他究竟有多少横,多少直,多少撇,多少点,和多少折,我们虽也可以计算出来,不过反反复复的计算数回,纵然幸免错误,也要耗费许多时光。况且按这个方法检字,非将全字写在纸上,拿着一支笔等到每一种笔画点过之后,就记下一个号码,这样才不至于忘记。否则在横笔上错了一笔,就差到万数上;在直笔上错了一笔,就差到千数上,比诸普通计算笔数的方法,所差只在前后一两笔者,反有逊色。所以我对于这方法,在发明之初,虽然十二分的高兴,可是后来也是十二分的痛恨它,反对它。因为这方法虽然易学,但检查起来很是困难,不独费时,而且最易发生错误的;所以我就毅然把它抛弃,另行研究别的方法。
我虽然不满意于上述的号码检字法,可是我始终觉得按号码顺序检字是最自然的方法。我因此细细推究号码检字法的根本缺憾,结果查出有两点。其一,因为号码是从计算而来的,七就是代表七笔,八就是代表八笔,计算很费工夫,而且容易错误。其二,因为顾到全体的笔画,不独多费时间,而且为着中国字书法的歧异(在字之内部尤甚),像昷字也作,青字也作靑,如果笔笔都要顾到,就不免增加许多错误。于是我就像对症发药一般,对于第一点,就把从前用来代表笔画数目的号码,去代表笔画的种类,譬如8并不是代表同样的八笔,乃代表一笔的左钩,9也不是代表同样的九笔,乃是代表一笔的右钩,详言之,当时的方法,规定把笔画分做九种,每种用一个号码代表;计开,1代表横或刁,2代表直,3代表交叉的直,4代表撇,5代表交叉的撇,6代表点或捺,7代表交叉的点捺,8代表左钩,9代表右钩。这样便可以一望而知其数,比从前须计算而得的号数便捷了好几倍,而且不至有计算的错误。对于第二点,我只取一个字四角的笔画去代表全体的笔画,譬如“江”字只要取左上角的“、”,右上角的“一”,左下角的和右下角的“一”,总共四笔;此外各笔一律可以不管。因此不独可以大大的节省检查时间,而且对于其他各笔的书法分歧,完全不致发生错误。这个方法,我叫他“四角号码检字法”,自从在民国十四年十一月发表以后,中外人士来信以及在各种刊物中间表示好评的,有八十多起。请求采用的有二十多起。像美国国会图书馆中国藏书部主任司温格尔(Swingle)先生,也请求照我的方法来排列卖国国会图书馆的中国图书目片。但我自己对于初次发表的四角号码检字法还不大满意,还是要继续的研究,所以我都劝他们等到我的改订方法出来再行采用。此外像东方图书馆,从民国十五年起实际上已经把书名片和著者片照这方法排列,检查上也很觉得便利。我所以对于这个原定四角号码检字法不甚满意,其中至少有几点:
(1)四角间或有不容易决定的;
(2)笔画也有不容易决定的;
(3)例外颇多;
(4)同码字数也有过多的。
因此我又费了两年工夫,一面实验,一面研究。结果才成功这里所发表的第二次改订四角号码检字法。其实我对于四角检字法已经改订了七十多次,不过因为正式发表的只有三次;第一次我叫它做原订四角检字法,所以对于第三次发表的,便给它这个名称。我现在将原订四角号码检字法过渡到第二次改订四角号码检字法,中间研究经过的情形,择要列下:
一、关于四角位次者 (A)按原订四角检字法,四角中最有疑义的就是左下角。所以我将位次改为(一)左上(二)右上(三)右下(四)左下,循环一周。如此便把左下角排在第四位,偶有错误,相差不过在个位,还易纠正。(B)我国文字,除单体外,分为上下层字和左右边字两种。因此,我也曾试验,对于单体字和上下层的字如“日”“昌”等,将四角位次仍作(一)左上(二)右上(三)左下(四)右下。对于左右边的如“鍾”字等,则将四角位次改为(一)左上(二)左下(三)右上(四)右下。
后来笔画种类多采复笔,且将单笔酌量归并;其结果则左下角已无疑义。故(A)项的位次变更非必要。又(B)项的位次变更,虽可使字形排列较为整齐;但现在改订的四角法,因采用复笔,及其他条件的结果,排列上已较前齐整,自无须兼取两种位次,以增应用上的麻烦。基此理由,此次改订的方法,便仍采用原定的四角位次。
二、关于笔画种类者 笔画种类,极关重要。凡记忆上的便利,每码所含字数的多少,以及四角决定的难易,大都靠着这项。所以我致力研究也最多。由前年发表的四角号码法过渡到此处发表的第二次改订四角检字法,中间已经把笔画的种类变更过多次。第一次将原订四角法的笔画顺序变动,以便记忆。第二次将笔画改为横直撇捺角头人十叉九种,第三次改为横直撇捺叉插方角附九种。第四次改为人二三叉插方角直斜九种。第五次改为横直撇捺人方角叉插杂十种。第六次改为横垂捺叉插方角八杂九种。第七次改为横垂捺叉插方角八小杂十种。第八次改为一垂捺四头六七八小圈十种。第九次始决定现在采用的头横垂点叉插方角八小十种。其倾向大抵初时专采简单笔画,以后兼采复合笔画。采用复笔最多的系第四次,计九种之中占有七种复笔;且其中二三两种各括有十余笔在内。其后,乃将复笔之繁难者删除,即如第九次所采定的表面上虽仍有七种复笔,实则各笔号码的顺序,都有意义,即如头居首位,横居第一位,叉为数目字之四,居第四位,角形似洋码之7居第七位,八形居第八位,小为最后之码,居第九位,此六码皆为现成的地位。此外垂点居横之后,插居叉之后,方居角之前。此四码亦甚自然,故记忆甚易,不至错误。又如笔形十种,虽有二十几笔,但形式上均以类相从,毫无混淆之弊。
三、关于规则者 原定四角检字法所定规则共十六条,且尚有若干例外未曾括入其中。此次改订的四角法只有正则四条,附则四条,绝无例外。
四、关于附角者 从前四角相同之字,须计算第一种笔画之数量,按其多少,加入第五码,此第五码之取得既由于计算数量,故其所需时间往往多于以前之四码。换句话说,要检出第五码,至少须照检出前四码加上一倍的时间。虽然这不过是一个补充办法,究竟美中不足。现在发明了附角,所以这第五码并不是代表第一种笔画之数量,却是代表附角笔画的种类。从时间上说起来,现在的五码不过等于照四码加上四分之一的时间;较从前加倍时间的可省去其八分之三。而且数笔画有时非将全字写出来不易明了,取附角则可以从脑筋中想像而得,尤为便利。
五、关于同号码字数之统计 按第一次四角检字法排列,八千八百五十八字共得一千七百五十六号码,平均每码容有五个字强。而按此次改订之四角检字法,则七千二百余字中四角共得二千二百九十余号码;平均每码所含不过三个字。若按附角排列,则共得四千四百七十余号码,平均每码不满二字。其详细统计见同码字统计表,兹不赘。
除了上述的研究状况以外,我还得说明下列几个最重要的实验:
(一)在上海规模最大的中小学校实地测验,从初小二年级起至高中三年级止,每级择优等中等及次等生各一人,在半小时内将原订四角号码检字法教给他们,再加十分钟练习,即以选定最有疑义的六十个字叫他们一一记注号码。结果则初小二年级学生绝对不能用部首法检字的,对于四角号码检字法,都很能应用检字。
(二)在东方图书馆暑期实习所中,以八十几个机关派来的实习员一百四十六人,用同等机会,举行部首法、笔数法和四角号码检字法三种竞争试验。结果四角号码法每字最速的只需时十秒点九,比部首法及笔数法平均每一单字可省一分半钟,而错误程序,却不及部首法八分之一。
(三)商务印书馆发报处有定户十四万余。从前按部首及笔数排列,检一户名需时辄在数十分钟,而且多有检查不出的;现照第二次改订四角号码检字法改排,每检一片,平均需时不过二十秒钟,比旧法省时十分钟以上。又该馆杂志定户,用外国文的不及中文十分之一,按着外国字母顺序排列,每检一片,平均需时四十九秒钟。所以四角号码法检字还用不了西文字母检字所需时间之半。
就这些实例观察,就可以证明这第二次改订四角号码检字法,的确是最易学而且最易检的方法。我现在再从客观方面,将本法的弱点和优点都尽情列举出来,以资比较。计开本检字法的弱点有二:
(甲)对于已识他种检字法者,须耗费半小时用至一小时,去研究本检字法。
但已了解本检字法之后,则一生可以节省二年之时间。因为现在人事日繁,不但读书的人,须检查字典辞典和图书馆卡片,就是办事的人,也有检查电话簿电码书商业名录和办公案卷等等之必要;假定一人从十岁起至五十岁止,四十年间每日平均检查十个字,单字词语各半。依照检查单字速率表,本检字法每字较部首法省一分二秒(部首法检不出之字尚未计算在内),较笔画法省时一分四十五秒,两者平均,则每一单字节省时间不下一分半。何况所检查的当然包括词语在内,本来检查词语较单字需时更多,采用本检字法后,所省时间自然也较单字更多。现在假定每一单字或词语平均省时二分钟,并非过当。如此,则一生共节省八千八百六十六小时。按每日工作八小时计算,可节省六百零八日,连星期休假计算,此六百零八日实等于两全年。
(乙)同形体之字不能尽排在一起。
但是旧法部首只有二百多个。每部容字多至数百,故不能不以同形体并列。本检字法兼按附角排列,则七八千字可分为四千多部,每部平均不过两个字,至多不过十几个字。再按补充的规定排列,则每字自为一部,简直没有同部的字。所以同形体的字能否排在一起,根本上便不成问题。
本检字法的优点有五:
(甲)是最彻底的方法
本检字法中任何条件,均经彻底的研究然后决定。即如字体一项,宋体与楷体不同,而宋体与宋体,楷体与楷体,亦各各殊异。本检字法虽以楷体为主,但于所有宋体楷体一切书法的歧异,莫不加以彻底研究,妥为救济。所以笔画种类中第一类包括横刁右钩。第二类包括直撇左钩。第三类包括点和捺等。和第八类之八,第九类之小,无一不含有很深的意义。例如龍字的左下角。有時作撇,有时作直;但本法撇和直总名为垂,属于同一号码,所以毫无问题。此外像这样的例子极多。故字体无论如何分歧错误,都可以一检即得。其他一切条件,也经过同样的彻底研究。有些方法虽看似简易,但只适于少数的字,本检字法则对于万字上下屡经实验,绝无问题。且有附角和依次计算第一二类笔数等的补充规定,无论字数多至几何,均可使每字有一定的地位。
(乙)是最迅速的方法
本法以一部分的笔画代表全体,以笔画的种类代替数量;又没有其他居间的条件或两可的规定。在理论上,当然是最迅速的方法。在事实上,则经过一二百人的竞争试验,每检一字,最速的不过需时十秒钟有零,也可以证明这是最迅速的方法。
(丙)是最自然的方法
每字的四角都是自然的位置,可以一望而知。不像偏旁笔顺等人为的条件,须有充分的预备知识始能够利用;而且纵有充分的知识,也因习惯的不同或记忆的强弱,而易起怀疑或误会。所以别的方法,都要有相当程序的人始能学。只有本法,可使初学的儿童,以及凡能认识十种笔画的人,都学得明白。
(丁)是最直接的方法
只要记得十种笔画,则按字得号码,按号码直接检查,不必依赖其他索引所注的页数或号码。
(戊)是粗而密的方法
所谓密就是创造本法的人,对于无论大小一切问题,都加以周密的研究,不肯模糊过去。
所谓粗,就是应用本法检字的人,只须很粗浅的观察,便可以得其号码。试将本法和我从前发明的号码检字法比较,便知道他的价值。例如“瀨”字依从前的号码检字法,须分次计算横直撇点折各有几笔,才能够得着63343这个号码。而且计算时须将其字写在纸上,逐回记明其笔数,才不致忘却。但照现在的四角号码法,检字者绝对用不着把这字写出来,只须在脑筋里想象一下,觉得这字的左上角是点形(其代表号码就是3),右上角是角形(其代表号码就是7),左下角是刁形(其代表号码就是1),右下角是八形(其代表号码就是8),这样一来,“瀨”字的四角号码3718便立时形成,岂不是万分的便利吗?
(十七年十月十日 王云五)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。