词素轮排索引法在构词词典编排中的应用 张琪玉
发布时间:2018-09-25  浏览次数:15

・索引与数据库漫笔・

词素轮排索引法在构词词典编排中的应用

张 琪 玉

(南京政治学院上海分院信息管理系  200433)

    构词词典是一种汉字轮排词典,可从任何一个汉字出发,查出包含该汉字的全部词组、成语、熟语,对文章修辞、语文教学、诗词写作、翻译工作等都有参考作用。

构词词典正文的编排形式如:

【平】

①平安  平白  平板  平版  平辈

平常 平川  平淡  平等  平地

平定 平凡  平方  平分  ……

②扁平  不平  持平  公平  和平

拉平 扫平  生平  太平  ……

①②平平

③素昧平生  一马平川  夷为平地

①③平起平坐

④打抱不平  粉饰太平  歌舞升平

或:

【平】

①~安  ~白  ~板  ~版  ~辈

~常 ~川  ~淡  ~等  ~地

~定 ~凡  ~方  ~分  ……

~~

~起~坐


②扁~  不~  持~  公~  和~

拉~ 扫~  生~  太~  ……

③素昧~生  一马~川  夷为~地

④打抱不~  粉饰太~  歌舞升~

    用数据库技术来编排这种词典的正文可大大节省时间,减少差错,办法是为每一汉字设一字段,共设A,B,C,D四个字段,每一字段占2个字节;再设一2字节字段安放有重复汉字的条目的标志。每一条词组、成语、熟语为一个记录。当全部数据输入完后,按下列方法进行整理:

A,B,C,D排序,形成AA文件(按第一个汉字排序的文件);

B,A,C,D排序,形成BB文件(按第二个汉字排序的文件);

C,A,B,D排序,形成CC文件(按第三个汉字排序的文件);

D,A,B,C排序,形成DD文件(按第四个汉字排序的文件)。

    将四个文件中含有同一特定汉字(如上例中的“平”字)的条目依次归并(需编一个小程序,否则要用人工归并),再对具有重复汉字标志的条目作适当处理。

    这种方法,除用于编制构词词典外,也可用于编制古籍的逐字索引。


张琪玉  南京政治学院上海分院信息管理系教授,中国索引学会副理事长。