用数字查字典的汉字三笔索引
黄大城
(汉字信息化工作室 四川南充 637000)
摘 要 查字典不找汉字的部首、不数汉字的笔画、不用汉字的拼音,不分简体字、繁体字、异体字,不分认识的字、不认识的字,一律用构成汉字的第一笔、第二笔和最后一笔的笔形序号查汉字,任何汉字都不需要难查字表,只用1-3数字直查直出,一道工序完成查字。
关键词 速查字典 汉字笔形 三笔索引 数字序号
1 引言
本方案涉及汉字的部首笔画索引、汉语拼音索引和四角号码查字法。是一种用构成汉字的第一笔、第二笔和最后一笔的笔形序号查检汉字的数字索引。
2 背景技术
中文汉字的索引,从公元100年许慎著《说文解字》发明的《部首笔画索引》到现在,己经使用了近2000年。此方法检索汉字用的是汉字的部首和笔画,而汉字的部首多达几百个,并且纷繁复杂不确定,部首与部首之间相互交融,有的部首里有部首,有的部首里有好几个部首,没有统一的标准,完全靠编纂者主观确定,他说是部首就是部首!检索时难以搞定用哪个部首才正确,即使是找对了部首,还要数部首的笔画,数了部首的笔画还要数部首之外的笔画,方法非常繁琐,步骤多,速度慢,准确性差,有些字还要通过难查字表才能查到,哪些字在难查字表里查没有规律性,只有在《部首笔画索引》里检索不到时就去难查字表里检索,检索一个字仅翻书的页数就要好几次,还必须数准部首和字的笔画画数,否则检索不到。近代出现的《汉语拼音索引》,检索汉字不用部首、不数笔画、方法简单、速度快,有取代《部首笔画索引》之势,但是它的根本缺点是不知读音的字不能查,不会拼音者不能用,查字典一般是在不认识这个字时查。于是乎不得不将《部首笔画索引》和《汉语拼音索引》都用在中文工具书前面。除《汉语拼音索引》之外,还有没有一种查字时不用部首、不数笔画、不用拼音,不分简体字、繁体字、异体字;不分认识不认识的字,都能一目了然的检索呢?为了找到答案,我从90年代就开始研究汉字结构,想解决这个几千年来汉字难查的难题。
3 研究目的
汉字是中华民族灿烂文化的主要载体。它的特点是集音、形、义于一身。历代学者,在汉字的字形、字义方面的研究已取得了许多突破。唯独在与汉字读音、释义联系甚紧的检索方面的研究却收效甚微,多少年来仍然袭用传统的三种主流索引:部首笔画索引、拼音索引、四角号码索引。然而这几种索引,既对中、小学生乃至成年人,在查找字时带来许多麻烦,也与现代中文发展状况很不相适应。为了寻找一种既简单又方便查字准确无误,速度快捷的查字法,经过十多年的精心研究,终于找到了极为简单而且没有丝毫障碍的查字方法:用汉字的笔形序号编著汉字索引。因为这种索引只用汉字的第一笔、第二笔和最后一笔检索汉字,所以称其为“三笔索引”。
4 实用价值
任何一种新事物的出现,都是为了适应社会发展的需要。如果它不能填补社会需求方面的某项空白,这种新事物不具有创新性,也就没有实用价值。“三笔索引”的创新之处在于:查字典不找汉字的部首、不数汉字的笔画、不用汉字的拼音,不分简体字、繁体字、异体字,不分认识的字、不认识的字,只用构成汉字的第一笔、第二笔和最后一笔的笔形序号查汉字。适用于小学生、初中生、高中生和需要快速查字的人群,特别是外国人学习中文时使用,享受没有丝毫障碍快速查字,节省时间的快乐,得到社会效益,服务于广大人民群众学习汉字使用汉字,减省学生学习汉字部首笔画的负担。
5 内容
汉字三笔索引是将组成所有汉字的基本单位归纳为11个笔形,并给每个笔形配置一个序号。即:[一=1]、[丨=2] 、[丿=3]、[丶=4]、[�=5]、[�=6]、[十=7]、[�氵=8]、[�=9]、[口=0]。只要记住这11个笔形和10个序号,查字不记字的部首、不数字的笔画、不找字的音序,不分简体字、繁体字、异体字,不分认识的字、不认识的字,不用查字表和难查字表,而是直查直出,一道工序完成,只用汉字的第一笔、第二笔和最后一笔的笔形序号检索汉字。例如要查[中]字,直翻索引页面一侧的数字排序[02]就完成查字程序,[中]字就准确无误的查出来。[中]字与排序[02]的转换关系是:[中]字是由上述10种笔形中的[口]笔形和[丨] 笔形组成的,[口]笔形的序号为[ 0 ],[丨] 笔形的序号为[2 ],因此[02]就是[中]字的三笔索引。例如查[福]字:[福]=[450],因为[福]字的第一笔的笔形是[丶],[丶=4],第二笔的笔形是[�],[�=5],第三笔的形是[口],[口=0]。所以[福]字的三笔索引排序号是[450]。其他字依此类推。用下面表1表2的笔形序号查所有汉字。
表1 汉字三笔索引笔形序号表
笔形 | 一 | 丨 | 丿 | 丶 | � | � | 十 | � | 氵 | � | 口 |
序号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 8 | 9 | 0 |
表2 汉字三笔索引基本笔形名称表
序号 | 笔 形 | 名 称 | 字 例: 字/序号 |
1 | 一() | 横(提) | 一/1 二/11 三/111 刁/51 |
2 | 丨 | 竖 | 上/211 凹/261 业/221 旧/201 |
3 | 丿 | 撇 | 川/322 气/316 亿/326 彻/333 |
4 | 丶 | 点 | 义/438 言/410 怀/444 语/460 |
5 | �(��) | 左折(钩) | 水/558 买/544 了/55 马/551 |
6 | �(�乙) | 右折(钩) | 台/640 女/631 绳/666 巢/668 |
7 | 十 | 十字架 | 古/70 木/738 南/727 喜/710 |
8 | � | 捺 | 八/38 夫/118 之/458 还/138 |
8 | 氵 | 三点水 | 江/811 洒/810 酒/810 洁/870 |
9 | � | 草字头 | 苗/907 苦/970 甘/911 革/912 |
0 | 口(囗○) | 口框零 | 哈/030 品/000 晶/010 国/014 |
说明: (1)表中横[一]笔形包括提[/] 笔形;
(2)表中左折[�]笔形包括所有向左折的钩和折;
(3)表中右折[�]笔形包括所有向右折的钩和折;
(4)表中[十、氵、�、口]笔形系复笔画笔形,不要拆成单笔画笔形;
(5)汉字末笔为[口]内有笔画的笔形,一律用[口]笔形的序号[0 ]。
6 对比研究
6.1 本方案与拼音查法比
(1)拼音查一个字,须循序下列三个步骤:
①判明〔该字正确读音〕;
②按照〔该字正确读音〕,循序翻到字典正文页次;
③在正文页次中,找到要查的字 。
(2)拼音查字法有以下两个缺点:
①不知读音,不能查字,不知汉字读音的情形有二种:
a.会汉语拼音或注音,但不认识要查的字;
b.不会汉语拼音或注音,但可能认识要查的字,也可能不认识要查的字。不论属于a.、b.当中那一种情形,都无法利用字音检索法查字。如果一本中文字典,以最低标准,收10,000个汉字,而一般人识字量大约3,000到5,000个字,另有5,000个以上的字不认识。对于这一半以上的汉字,不能用字音去查找,使字典的功能去掉了一大半。如为大型字典,不认识的字更多,能查的字比例就更小。从使用者来说,会读的字可能要查字典,但对于不会读的字更需要查字典。不知读音不能查,是字音查字法最大的盲点。有了这个盲点,汉字检索的问题,基本上没有解决。
②同音字多,查字不快:
汉字以形为主,音为辅,天生多同音字。用读音检字,要在众多的同音字中查找目标字,速度快不起来。如按字典最低标准,收字10,000个,同音字的比率平均为1比30,即每一个读音,平均有30个同音的汉字。
例如:在第10版《新华字典》中,以读音[a]起首的各字中,其排序是这样的:
a………阿呵啊锕腌呵啊嗄呵啊呵啊呵啊(共14字);
ai…… 哎哀锿埃挨唉�嗳挨皑癌��嗳矮蔼霭艾砹唉爱嗳嫒瑷�暧隘嗌碍(共42字);
an……厂广安桉氨�鞍庵鹌谙��铵俺埯�揞犴岸按案胺暗黯(共27字);
ang……肮昂盎(共 4 字);
ao…… 凹熬敖�遨嗷廒�獒熬聱螯�鳌翱鏖拗袄媪岙�坳拗�傲骜鏊奥�澳懊(共41 字)。
其中〔ao〕音的字最多,共41字,〔ai〕为42字。如所收字数为20,000个的字典,同音字的比率平均值为1比60,即每一个读音,平均有60个同音的汉字。收字数愈多,同音字的比率亦愈高。
英文字典查得快的原因是,英文中没有拼法完全相同的二个字,所以查得快。
如今汉字有这么多同音字,查字的速度就快不起来。
6.2 与部首查字法相比
(1)部首检索法查一个字步骤太多,必须循下列六个步骤:
①判明目标字的〔部首〕,并数其笔画数;
②根据部首笔画翻阅〔部首目录〕,查找目标〔部首〕,得出检字表的页次;
③根据〔检字表〕页次,查找检字表中的目标〔部首〕;
④找到〔检字表〕中的目标〔部首〕,再数其余笔画数;
⑤根据其余笔画,依序找到检字表中某字和其在正文中页次;
⑥按正文页次,依笔画数排序找到要查的字。
若在第①项判断失误,就找不到字。如数错笔画,也找不到字。为了弥补这项缺陷,一般字典又增列了[难检字笔画索引],不分部首,按该字总笔画数,在这个笔画数下去寻找,亦可查得,但速度更慢。
(2)部首查字有四大缺点:
①方法繁琐,速度太慢
汉字按照部首排列,方法虽好,但依照以上步骤,查一个汉字,要做一次[部首]判断,需数二次笔画,翻二个字表,经三次查找,才能找到它在正文中的位置。其中若有失误,必须重来,或使用难检字笔画索引的补救办法。这种方法,过于繁琐,速度太慢。
②部首不明,位置多变
除了步骤繁琐,速度太慢,是其最大缺陷。实际使用时,部首查字法还有一些陷阱。如:部首的定义不明确,归属欠合理,位置不固定,有些字使用者难以捉摸。
譬如:正、五、丕、互、亚、开、井、等字属于〔二〕部。
中、串、丰、韦、书、�、半等字属于〔丨〕部。
其他如:为、卫、也、及、长、乃、与、民、北、兆、册、等字都是极普通的字,你可知道它们各属于什么部首?
③多笔连笔,容易数错
数笔画不但费时,笔画多时更容易数错,连笔字数错的机会更多。例如:凹、凸、�、赢、嚼、�、�、曦、�、�、�等字,各有多少笔?
④同笔画字多,容易看漏
同笔画的字太多时容易看漏,同部首的汉字,以八九画的字数量最多,一跨很多页,次序又不明确,寻找目标字,如沙中淘金,容易看漏,必须反复寻找。
6.3 与四角号码检字法比
四角号码检字法是根据汉字方块形状的特点,以汉字四角的各种笔形配一个阿拉伯数字代码。代号按〔左上角-右上角-左下角-右下角〕的次序组合,然后按号码大小依次编排。
例如:高=0022 他=2421 跟=6713 叙=8794
四角号码检字法原称四角号码查字法,王云五先生发表于1926年3月出版的《东方杂志》,两年后商务印书馆出版了《四角号码字典》是早期汉字代码中比较著名的方法。
新中国成立以后,该检字法经中国文字改革委员会汉字查字法整理工作组的若干修改,公布了新的四角号码查字法(草案)。1977年出版的《四角号码新词典》(修订重排本)即按新法编排,致使四角号码法有新法、旧法之分,但无论旧法与新法,都难免日渐被世人淡忘。四角号码检字法的码源单位是汉字的角形,与汉字的内部结构没有联系,对学习汉字没有帮助,而且角形杂乱不好确定,使用者不好掌握,编码较长有4码或5码,不易学和记。
6.4 三种方法比较列表说明
以第10版《新华字典》中的[福]、[献]二字为例比较如下:
表3 第10版《新华字典》中的[福]、[献]二字比较
科目 比项 | 三 笔 索 引 | 部 首 笔 画 | 汉 语 拼 音 |
字 例 | 福 | 献 | 福 | 献 | 福 | 献 |
部首笔画笔形序号及页次 | 丶=4 �=5口=0 | 十=7 丨=2丶=4 | 礻=4画 检字表71页 | 十 =2画 检字表42页 | X | X |
部首外笔画及页次 | X | X | �= 9 画 同画字29个 | 冂半犬=11画 同画字19个 | X | X |
查字表 | X | X | 至少查二个字表 | X | X |
拼 音 (首音) | X | X | X | X | fu | Xian |
检索码 | 450 | 724 | 正文第137页 | 正文第523页 | fu | Xian |
同 类 字 数 | 共7字 | 共4字 | 共54字 | 共65字 | 共98字 | 共57字 |
综 合 评 述 | 不用数笔画不必会 读音,查字速度快 | 笔画数二次 查字手续繁 | 必须会读会拼 检字速度不快 |
由上表各项比较可知,汉字三笔索引,步骤少,同码少,不记部首,不查拼音,不数笔画,检索最快;部首笔画索引,要数两次笔画,同画数字多,检索最慢;汉语拼音索引,[福]字的同音字有98个,检索亦不能快,如果遇到不会读的字,便打了死结,不能彻底解决用一种方法检索所有汉字的问题。
7 三笔索引的优点
(1)三笔索引克服了上述所有缺点,查字不找部首,不查拼音,不数笔画,不用难查字表;不分简体字、繁体字、异体字、认识的字、不认识的字,都能直查直出,一道工序完成,查字又快又准。
(2)形近字排在一起,符合形声造字规律。
①形近字排在一起,符合造字法规律,对于字义了解,容易触类旁通,能突显汉字优点,有利于识字辨字对学习汉字有帮助。例如序号为:
417=�、瓣、辨、辩、辫、�……
②相近的字排在一起,字形变化比较整齐,视觉上比按字音和部首笔画排序较有美感。例如:
516=己、已、巳;420=问、间、闾、阁、�、阊、阃、阔、�、阍;418=哀、衷、衰、�、裹、裒、袤、�、亵、�、褒、�
按三笔索引排序,这些同序号字,也就自然地排在一起了。
③可以解决简体字繁体字排序在一起,进行简繁字对照。例如:
000=�器 004=�� 011=哑� 013=畅� 014=国�
028=蛱� 121=亚�垩� 178=瑷�……
(3)实用性强,准确性高,简体繁体异体字通用。
[�=418褒=418][�=418亵=418][�=000器=000]
[�=542邓=542][�=124松=734][�=554孙=554]
[�=707干=17 ][�=318制=315][�=130面=130]
[�=360台=640][�=414志=714][�=417准=411]
[锺=311钟=312][�=632婵=632][�=348爱=348]
8 适用对象
三笔索引具有简单、准确、快捷、实用的特点,适用于小学生、初中生、高中生和需要快速查字的人群,特别适合外国人学习中文使用。
9 具体实施方式
按10版《新华字典》的汉字编纂汉字三笔索引具体实施方式见表4。
10 结束语
汉字三笔索引是将组成所有汉字的基本单位归纳为11个笔形,并给每个笔形配置一个序号来编纂字典索引。字典采用本索引,使用者享受没有丝毫障碍快速查汉字节省时间的快乐;还可免除学生学习汉字部首笔画的负担;方便于学习汉字,特别是外国人学习中文使用汉字。作者用本方案按第10版《新华字典》全部汉字编写了《第10版新华字典汉字三笔索引》。2008年6月份在几所学校测评结果,查生字的速度比“部首笔画查字法”快7.6倍。
表4 汉字三笔索引示例
(以第一笔笔形为“口”序号为“0”的汉字为例列举一页于下)
O口 | 1一 | 2丨 | 3丿 | 4丶 | 5� | 6� | 7十 | 8� | 8氵 | 9� | 口 | 0 |
汉字三笔索引 | |
1.按笔形序号0123456789顺序排序 | |
2.笔形上面的数字为三笔索引序号 | |
3.汉字右边的数字为新华字典正文页码 | |
4.’符号表示该字为繁体或异体字 | |
O | �' | 317 | 咽 | 549 | 黾 | 338 | 唔 | 351 | 瞎 | 517 | O |
口 | �' | 319 | 咽 | 554 | 咒 | 633 | 唔 | 508 | 瞻 | 609 | OO |
口 | 265 | �' | 460 | 咽 | 562 | 鼍 | 492 | 哂 | 435 | O11 | OOO |
○ | 301 | 骂 | 321 | � | 171 | �' | 492 | 啪 | 361 | 口一一 | OO1 |
OO | 鹗' | 116 | �' | 171 | OO7 | 喈 | 230 | 呈 | 57 | OO2 |
口口 | OO2 | � | 316 | 口口十 | 嘈 | 43 | 呸 | 367 | OO3 |
吕 | 312 | 口口丨 | � | 317 | � | 217 | 囗一口 | � | 99 | OO4 |
囗口 | 串 | 67 | � | 319 | OO8 | 圄 | 587 | � | 516 | OO5 |
回 | 198 | �' | 551 | 喁 | 578 | 口口� | 口一口 | 哑 | 547 | OO6 |
OOO | 呷 | 517 | 喁 | 585 | �' | 198 | (日) | 哑 | 548 | OO7 |
口口口 | 呻 | 433 | 嗯 | 345 | �' | 198 | 昌 | 50 | �' | 547 | OO8 |
品 | 376 | �' | 48 | 嗯 | 346 | 噪 | 602 | 晶 | 240 | �' | 548 | OO9 |
唱 | 52 | �' | 83 | 嗯 | 351 | 喂 | 502 | 暑 | 447 | 啦 | 273 | O1 |
�' | 388 | �' | 427 | 嗯 | 352 | 嘬 | 66 | 晷 | 169 | 啦 | 274 | O10 |
器 | 388 | �' | 49 | 嘿 | 182 | 嘬 | 652 | �' | 179 | 喹 | 270 | O11 |
嚣 | 527 | �' | 467 | 嘿 | 343 | �' | 357 | �' | 541 | 喱 | 285 | |
� | 573 | �' | 25 | 颚 | 116 | �' | 448 | 晌 | 429 | �' | 288 | |
囗口口 | �' | 83 | �' | 609 | �' | 449 | 晒 | 425 | 嚯 | 204 | |
�' | 488 | 鄂 | 115 | �' | 446 | �' | 453 | 晗 | 175 | �' | 355 | |
OO1 | OO3 | 囗口丶 | �' | 551 | 晤 | 511 | � | 527 | |
口口一 | 囗口丿 | 圆 | 591 | �' | 49 | 暗 | 6 | 口一一 | |
哩 | 284 | � | 266 | 圜 | 194 | O1 | 曙 | 448 | (日) | |
哩 | 286 | OO4 | 圜 | 592 | 口一 | 口一口 | 旦 | 84 | |
哩 | 291 | 口口丶 | OO6 | 日 | 414 | (目) | 昱 | 588 | |
喟 | 272 | 虽 | 460 | 口口� | 曰 | 593 | 眙 | 565 | 显 | 521 | |
�' | 308 | 哭 | 266 | �' | 633 | O1O | �' | 272 | 星 | 533 | |
�' | 309 | 哭 | 267 | 喝 | 179 | 口一口 | 睹 | 107 | 里 | 286 | |
�' | 316 | 患 | 195 | 喝 | 182 | 唔 | 345 | 瞄 | 336 | 量 | 294 | |
参考文献
1 李尔钢.现代辞典学导论.上海:格致出版业,2002.4
2 杨正业.对辞典特性和辞典学学科地位的再认识.西华师范大学学报,2002(3)
3 张晓芬,杨超.逆序现代汉语词典指瑕.现代语文研究,2008(4)
4 颜娜.新词词典编纂的创新路经探索.现代语文(语言研究),2008(4)
黄大城 四川省南充市干休所调研员。