用数字查字典的汉字三笔索引 黄大城
发布时间:2018-09-25  浏览次数:51

用数字查字典的汉字三笔索引

黄大城

(汉字信息化工作室  四川南充  637000

    查字典不找汉字的部首、不数汉字的笔画、不用汉字的拼音,不分简体字、繁体字、异体字,不分认识的字、不认识的字,一律用构成汉字的第一笔、第二笔和最后一笔的笔形序号查汉字,任何汉字都不需要难查字表,只用1-3数字直查直出,一道工序完成查字。

关键词  速查字典  汉字笔形  三笔索引  数字序号

 

1  引言

本方案涉及汉字的部首笔画索引、汉语拼音索引和四角号码查字法。是一种用构成汉字的第一笔、第二笔和最后一笔的笔形序号查检汉字的数字索引。

2  背景技术

中文汉字的索引,从公元100许慎著《说文解字》发明的《部首笔画索引》到现在,己经使用了近2000年。此方法检索汉字用的是汉字的部首和笔画,而汉字的部首多达几百个,并且纷繁复杂不确定,部首与部首之间相互交融,有的部首里有部首,有的部首里有好几个部首,没有统一的标准,完全靠编纂者主观确定,他说是部首就是部首!检索时难以搞定用哪个部首才正确,即使是找对了部首,还要数部首的笔画,数了部首的笔画还要数部首之外的笔画,方法非常繁琐,步骤多,速度慢,准确性差,有些字还要通过难查字表才能查到,哪些字在难查字表里查没有规律性,只有在《部首笔画索引》里检索不到时就去难查字表里检索,检索一个字仅翻书的页数就要好几次,还必须数准部首和字的笔画画数,否则检索不到。近代出现的《汉语拼音索引》,检索汉字不用部首、不数笔画、方法简单、速度快,有取代《部首笔画索引》之势,但是它的根本缺点是不知读音的字不能查,不会拼音者不能用,查字典一般是在不认识这个字时查。于是乎不得不将《部首笔画索引》和《汉语拼音索引》都用在中文工具书前面。除《汉语拼音索引》之外,还有没有一种查字时不用部首、不数笔画、不用拼音,不分简体字、繁体字、异体字;不分认识不认识的字,都能一目了然的检索呢?为了找到答案,我从90年代就开始研究汉字结构,想解决这个几千年来汉字难查的难题。

3  研究目的

汉字是中华民族灿烂文化的主要载体。它的特点是集音、形、义于一身。历代学者,在汉字的字形、字义方面的研究已取得了许多突破。唯独在与汉字读音、释义联系甚紧的检索方面的研究却收效甚微,多少年来仍然袭用传统的三种主流索引:部首笔画索引、拼音索引、四角号码索引。然而这几种索引,既对中、小学生乃至成年人,在查找字时带来许多麻烦,也与现代中文发展状况很不相适应。为了寻找一种既简单又方便查字准确无误,速度快捷的查字法,经过十多年的精心研究,终于找到了极为简单而且没有丝毫障碍的查字方法:用汉字的笔形序号编著汉字索引。因为这种索引只用汉字的第一笔、第二笔和最后一笔检索汉字,所以称其为“三笔索引”。

4  实用价值

任何一种新事物的出现,都是为了适应社会发展的需要。如果它不能填补社会需求方面的某项空白,这种新事物不具有创新性,也就没有实用价值。“三笔索引”的创新之处在于:查字典不找汉字的部首、不数汉字的笔画、不用汉字的拼音,不分简体字、繁体字、异体字,不分认识的字、不认识的字,只用构成汉字的第一笔、第二笔和最后一笔的笔形序号查汉字。适用于小学生、初中生、高中生和需要快速查字的人群,特别是外国人学习中文时使用,享受没有丝毫障碍快速查字,节省时间的快乐,得到社会效益,服务于广大人民群众学习汉字使用汉字,减省学生学习汉字部首笔画的负担。

5  内容

汉字三笔索引是将组成所有汉字的基本单位归纳为11个笔形,并给每个笔形配置一个序号。即:[=1]、[=2 、[丿=3]、[=4]、[�=5]、[�=6]、[十=7]、[�=8]、[�=9]、[口=0]。只要记住这11个笔形和10个序号,查字不记字的部首、数字的笔画、不找字的音序,不分简体字、繁体字、异体字,不分认识的字、不认识的字,不用查字表和难查字表,而是直查直出,一道工序完成,只用汉字的第一笔、第二笔和最后一笔的笔形序号检索汉字。例如要查[中]字,直翻索引页面一侧的数字排序[02]就完成查字程序,[中]字就准确无误的查出来。[中]字与排序[02]的转换关系是:[中]字是由上述10种笔形中的[口]笔形和[笔形组成的,[口]笔形的序号为[ 0 ],[笔形的序号为[2 ],因此[02]就是[中]字的三笔索引。例如查[福]字:[福]=[450],因为[福]字的第一笔的笔形是[],[丶=4],第二笔的笔形是[�],[�=5],第三笔的形是[口],[口=0]。所以[福]字的三笔索引排序号是[450]。其他字依此类推。用下面表12的笔形序号查所有汉字。

1  汉字三笔索引笔形序号表

笔形

丿

序号

1

2

3

4

5

6

7

8

8

9

0

 

2  汉字三笔索引基本笔形名称表

序号

  

  

字 例: 字/序号

1

横(提)

/1    /11   /111  /51  

2

/211  /261  /221  /201 

3

丿

/322  /316  亿/326  /333 

4

/438  /410  怀/444  /460 

5

�(��)

左折(钩)

/558  /544  /55   /551 

6

�(�乙)

右折(钩)

/640  /631  /666  /668 

7

十字架

/70   /738  /727  /710 

8

/38   /118  /458  /138  

8

三点水

/811  /810  /810  /870   

9

草字头

/907  /970  /911  /912 

0

口(○)

口框零

/030  /000  /010  /014

 

说明: 1)表中横[]笔形包括提[/ 笔形;

2)表中左折[�]笔形包括所有向左折的钩和折;

3)表中右折[�]笔形包括所有向右折的钩和折;

4)表中[十、、�、口]笔形系复笔画笔形,不要拆成单笔画笔形;

5)汉字末笔为[口]内有笔画的笔形,一律用[口]笔形的序号[0 ]。

6  对比研究

6.1  本方案与拼音查法比

(1)拼音查一个字,须循序下列三个步骤:

①判明〔该字正确读音〕;

②按照〔该字正确读音〕,循序翻到字典正文页次;

③在正文页次中,找到要查的字

(2)拼音查字法有以下两个缺点:

①不知读音,不能查字,不知汉字读音的情形有二种:

a.会汉语拼音或注音,但不认识要查的字;

b.不会汉语拼音或注音,但可能认识要查的字,也可能不认识要查的字。不论属于a.b.当中那一种情形,都无法利用字音检索法查字。如果一本中文字典,以最低标准,收10,000个汉字,而一般人识字量大约3,0005,000个字,另有5,000个以上的字不认识。对于这一半以上的汉字,不能用字音去查找,使字典的功能去掉了一大半。如为大型字典,不认识的字更多,能查的字比例就更小。从使用者来说,会读的字可能要查字典,但对于不会读的字更需要查字典。不知读音不能查,是字音查字法最大的盲点。有了这个盲点,汉字检索的问题,基本上没有解决。

②同音字多,查字不快:

汉字以形为主,音为辅,天生多同音字。用读音检字,要在众多的同音字中查找目标字,速度快不起来。如按字典最低标准,收字10,000个,同音字的比率平均为130,即每一个读音,平均有30个同音的汉字。

例如:在第10版《新华字典》中,以读音[a起首的各字中,其排序是这样的:

a………阿呵啊锕腌呵啊嗄呵啊呵啊呵啊(14)

ai…… 哎哀锿埃挨唉�嗳挨�嗳矮蔼霭砹唉爱嗳嫒瑷�暧隘嗌(42)

an……厂广安桉氨�鞍庵谙��铵俺埯�揞犴岸按案胺暗黯(27)

ang……( 4 )

ao…… 敖�遨聱螯�鳌翱鏖拗袄媪岙坳拗�傲骜鏊(41 )

其中〔ao〕音的字最多,共41字,〔ai〕为42字。如所收字数为20,000个的字典,同音字的比率平均值为160,即每一个读音,平均有60个同音的汉字。收字数愈多,同音字的比率亦愈高。

英文字典查得快的原因是,英文中没有拼法完全相同的二个字,所以查得快。

如今汉字有这么多同音字,查字的速度就快不起来。

6.2  与部首查字法相比

(1)部首检索法查一个字步骤太多,必须下列六个步骤:

①判明目标字的〔部首〕,并数其笔画数;

②根据部首笔画翻阅〔部首目录〕,查找目标〔部首〕,得出检字表的页次;

③根据〔检字表〕页次,查找检字表中的目标〔部首〕;

④找到〔检字表〕中的目标〔部首〕,再数其余笔画数;

⑤根据其余笔画,依序找到检字表中某字和其在正文中页次;

⑥按正文页次,依笔画数排序找到要查的字。

若在第①项判断失误,就找不到字。如数错笔画,也找不到字。为了弥补这项缺陷,一般字典又增列了[难检字笔画索引],不分部首,按该字总笔画数,在这个笔画数下去寻找,亦可查得,但速度更慢。

(2)部首查字有四大缺点:

①方法繁琐,速度太慢

汉字按照部首排列,方法虽好,但依照以上步骤,查一个汉字,要做一次[部首]判断,需数二次笔画,翻二个字表,经三次查找,才能找到它在正文中的位置。其中若有失误,必须重来,或使用难检字笔画索引的补救办法。这种方法,过于繁琐,速度太慢。

②部首不明,位置多变

除了步骤繁琐,速度太慢,是其最大缺陷。实际使用时,部首查字法还有一些陷阱。如:部首的定义不明确,归属欠合理,位置不固定,有些字使用者难以捉摸。

 譬如:正、五、、互、亚、开、井、等字属于〔二〕部。

       中、串、丰、韦、书、�、半等字属于〔丨〕部。

其他如:为、卫、也、及、长、乃、与、民、北、兆、册、等字都是极普通的字,你可知道它们各属于什么部首?

③多笔连笔,容易数错

数笔画不但费时,笔画多时更容易数错,连笔字数错的机会更多。例如:、�、赢、嚼、、�、曦、�、�、�等字,各有多少笔?

④同笔画字多,容易看漏

同笔画的字太多时容易看漏,同部首的汉字,以八九画的字数量最多,一跨很多页,次序又不明确,寻找目标字,如沙中淘金,容易看漏,必须反复寻找。

6.3  与四角号码检字法比

四角号码检字法是根据汉字方块形状的特点,以汉字四角的各种笔形配一个阿拉伯数字代码。代号按〔左上角-右上角-左下角-右下角〕的次序组合,然后按号码大小依次编排。

例如:高=0022 =2421 =6713 =8794

四角号码检字法原称四角号码查字法,王云五先生发表于19263月出版的《东方杂志》,两年后商务印书馆出版了《四角号码字典》是早期汉字代码中比较著名的方法。

新中国成立以后,该检字法经中国文字改革委员会汉字查字法整理工作组的若干修改,公布了新的四角号码查字法(草案)1977年出版的《四角号码新词典》(修订重排本)即按新法编排,致使四角号码法有新法、旧法之分,但无论旧法与新法,都难免日渐被世人淡忘。四角号码检字法的码源单位是汉字的角形,与汉字的内部结构没有联系,对学习汉字没有帮助,而且角形杂乱不好确定,使用者不好掌握,编码较长有45易学和记。

6.4  三种方法比较列表说明

以第10版《新华字典》中的[福]、[献]二字为例比较如下:

3  10版《新华字典》中的[福]、[献]二字比较

科目

   比项

三 笔 索 引

  部 首 笔 画

汉 语 拼 音

 

部首笔画笔形序号及页次

4

�=5口=0

十=7

24

 4

检字表71

 十 =2

检字表42

部首外笔画及页次

= 9
同画字29

冂半犬=11
同画字19

查字表

至少查二个字表

 
(
首音)

fu

Xian

检索码

450

724

正文第137

正文第523

fu

Xian

 
 

7

4

54

65

98

57

 
 

不用数笔画不必会
 
读音,查字速度快

笔画数二次
查字手续繁

必须会读会拼
检字速度不快

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

由上表各项比较可知,汉字三笔索引,步骤少,同码少,不记部首,不查拼音,不数笔画,检索最快;部首笔画索引,要数两次笔画,同画数字多,检索最慢;汉语拼音索引,[福]字的同音字有98个,检索亦不能快,如果遇到不会读的字,便打了死结,不能彻底解决用一种方法检索所有汉字的问题。

7  三笔索引的优点

(1)三笔索引克服了上述所有缺点,查字不找部首,不查拼音,不数笔画,不用难查字表;不分简体字、繁体字、异体字、认识的字、不认识的字,都能直查直出,一道工序完成,查字又快又准。

(2)形近字排在一起,符合形声造字规律。

①形近字排在一起,符合造字法规律,对于字义了解,容易触类旁通,能突显汉字优点,有利于识字辨字对学习汉字有帮助。例如序号为:

417=�、瓣、辨、辩、辫、�……

②相近的字排在一起,字形变化比较整齐,视觉上比按字音和部首笔画排序较有美感。例如:

516=己、已、420=问、间、、阁、�、、阔、�、418=哀、、衰、�、裹、、�、亵、�、褒、�

按三笔索引排序,这些同序号字,也就自然地排在一起了。

③可以解决简体字繁体字排序在一起,进行简繁字对照。例如:

000=�器  004 011=哑�  013=畅  014=国

028 121=亚�垩�  178�……

(3)实用性强,准确性高,简体繁体异体字通用。

[�=418褒=418][�=418418][�=000器=000

[�=542542][�=124松=734][�=554孙=554

707干=17 ][�=318制=315][�=130面=130

[�=360台=640][�=414志=714][417准=411

311钟=312][632632][348爱=348

8  适用对象

三笔索引具有简单、准确、快捷、实用的特点,适用于小学生、初中生、高中生和需要快速查字的人群,特别适合外国人学习中文使用。

9  具体实施方式

   10版《新华字典》的汉字编纂汉字三笔索引具体实施方式见表4

10  结束语

   汉字三笔索引是将组成所有汉字的基本单位归纳为11个笔形,并给每个笔形配置一个序号来编纂字典索引。字典采用本索引,使用者享受没有丝毫障碍快速查汉字节省时间的快乐;还可免除学生学习汉字部首笔画的负担;方便于学习汉字,特别是外国人学习中文使用汉字。作者用本方案按第10版《新华字典》全部汉字编写了《第10版新华字典汉字三笔索引》。20086月份在几所学校测评结果,查生字的速度比“部首笔画查字法”快7.6倍。

4  汉字三笔索引示例

(以第一笔笔形为“口”序号为“0”的汉字为例列举一页于下)

O

1

2

3丿

4

5

6

7

8

8

9

0

  汉字三笔索引

 

     1.按笔形序号0123456789顺序排序

 

    2.笔形上面的数字为三笔索引序号

 

        3.汉字右边的数字为新华字典正文页码

 

    4.’符号表示该字为繁体或异体字

 

O

'

317

549

338

351

517

O

'

319

554

633

508

609

OO

265

'

460

562

492

435

O11

OOO

301

321

171

'

492

361

口一一

OO1

OO

'

116

'

171

OO7

230

57

OO2

口口

OO2

316

口口十

43

367

OO3

312

口口

317

217

一口

99

OO4

67

319

OO8

587

516

OO5

198

'

551

578

口口�

口一口

547

OO6

 OOO

517

585

'

198

(日)

548

OO7

口口口

433

345

'

198

50

'

547

OO8

376

'

48

346

602

240

'

548

OO9

52

'

83

351

502

447

273

O1

'

388

'

427

352

66

169

274

O10

388

'

49

182

652

'

179

270

O11

527

'

467

343

'

357

'

541

285

 

573

'

25

116

'

448

429

'

288

 

口口

'

83

'

609

'

449

425

204

 

'

488

115

'

446

'

453

175

'

355

 

OO1

OO3

'

551

511

527

 

口口

丿

591

'

49

6

口一一

 

284

266

194

O1

448

(日)

 

286

OO4

592

 

口一口

84

 

291

口口

OO6

414

(目)

588

 

272

460

口口�

593

565

521

 

'

308

266

'

633

O1O

'

272

533

 

'

309

267

179

口一口

107

286

 

'

316

195

182

345

336

294

 

 

参考文献

1  李尔钢.现代辞典学导论.上海:格致出版业,2002.4

2  杨正业.对辞典特性和辞典学学科地位的再认识.西华师范大学学报,20023

3  张晓芬,杨超.逆序现代汉语词典指瑕.现代语文研究,20084

4  颜娜.新词词典编纂的创新路经探索.现代语文(语言研究)20084

 

黄大城  四川省南充市干休所调研员。