・索引与数据库漫笔・
词素轮排索引法在构词词典编排中的应用
张 琪 玉
(南京政治学院上海分院信息管理系 200433)
构词词典是一种汉字轮排词典,可从任何一个汉字出发,查出包含该汉字的全部词组、成语、熟语,对文章修辞、语文教学、诗词写作、翻译工作等都有参考作用。
构词词典正文的编排形式如:
【平】
①平安 平白 平板 平版 平辈
平常 平川 平淡 平等 平地
平定 平凡 平方 平分 ……
②扁平 不平 持平 公平 和平
拉平 扫平 生平 太平 ……
①②平平
③素昧平生 一马平川 夷为平地
①③平起平坐
④打抱不平 粉饰太平 歌舞升平
或:
【平】
①~安 ~白 ~板 ~版 ~辈
~常 ~川 ~淡 ~等 ~地
~定 ~凡 ~方 ~分 ……
~~
~起~坐
②扁~ 不~ 持~ 公~ 和~
拉~ 扫~ 生~ 太~ ……
③素昧~生 一马~川 夷为~地
④打抱不~ 粉饰太~ 歌舞升~
用数据库技术来编排这种词典的正文可大大节省时间,减少差错,办法是为每一汉字设一字段,共设A,B,C,D四个字段,每一字段占2个字节;再设一2字节字段安放有重复汉字的条目的标志。每一条词组、成语、熟语为一个记录。当全部数据输入完后,按下列方法进行整理:
按A,B,C,D排序,形成AA文件(按第一个汉字排序的文件);
按B,A,C,D排序,形成BB文件(按第二个汉字排序的文件);
按C,A,B,D排序,形成CC文件(按第三个汉字排序的文件);
按D,A,B,C排序,形成DD文件(按第四个汉字排序的文件)。
将四个文件中含有同一特定汉字(如上例中的“平”字)的条目依次归并(需编一个小程序,否则要用人工归并),再对具有重复汉字标志的条目作适当处理。
这种方法,除用于编制构词词典外,也可用于编制古籍的逐字索引。
张琪玉 南京政治学院上海分院信息管理系教授,中国索引学会副理事长。