简便易行的机编词表软件――MultiTes 杨俊梅 刘 俊 侯汉清
发布时间:2018-09-25  浏览次数:23

简便易行的机编词表软件――MultiTes*

杨俊梅      侯汉清

(南京农业大学信息管理系  210095)

    在实际使用的基础上,本文介绍一种国外流行的、简便易用的机编词表软件――MultiTes 2005 Pro。作者详述了该软件的主要功能、结构、界面和使用方法,并进行了简要的评价。

关键词  电子叙词表  叙词表编制  词表编制软件  MultiTes

 

1  MultiTes的功能及特点

MultiTes 2005 Pro1]是由Multisystems公司推出的叙词表编制软件MultiTes的最新版本。Multisystems1983年采用dBaseII编程语言开发了第一种叙词表管理计算机软件,起初这种软件只有单机版[2]。经过不断的创新,MultiTes 2005 Pro无论在单机环境下还是网络环境下,都能够非常方便地编制、浏览和维护叙词表、分类表及其他类型的受控词表[1][3],并且它允许用户管理一系列术语列表、叙词表、标题表、分类表、多级叙词表、范畴索引和多语种叙词表[3]。MultiTes 2005 Pro的主要功能和特点包括有:

・支持美国标准学会(ANSI)和美国国家信息标准化组织(NISO)制定的关于受控词表编制的新的国家标准,包括词间关系(用、代、属、分、参等)的规定,允许用户自定义词间关系、范畴、语种和注释等。

・支持叙词表等级关系的单级显示和全显示(即显示叙词的各级上下位词)。

・支持多语种词表。

・在两词之间建立关系时,系统对逻辑错误的词间关系具有自动报错功能。

・自动生成叙词间的对应关系。

・对词表中的叙词数量、词间关系的类型、类目等级和规模皆没有限制(除了受到计算机本身内存大小的限制)。

・多种数据导入方式:利用自由文本模板快速输入数据、通过剪贴板拷贝/粘贴数据、在同一台计算机上不同词表间拷贝数据。

・高级检索可以提供叙词词串、注释内容、类别、标记、状态和类型等的检索。

・输出多种类型词表:包括字顺表、词族索引、等级关系全显示的字顺表、范畴索引、轮排索引等。

・输出多种格式词表:包括TXTCSV(逗号分隔值文件)、HTMLXML等。

2  MultiTes的结构和界面1  Multites的主界面

2.1 菜单栏

菜单栏的系统功能可以通过下拉菜单方式实现:

“文件(File)”是对词表的基本操作,比如新建、打开、关闭、备份、导入一个文件或显示词表信息等。“编辑(Edit)”可以实现对叙词款目进行各种操作,比如复制、粘贴、剪贴板、编辑词语、删除、标记的添加和移除等。

“定义(Define)”允许用户自定义词间关系、范畴、语种,设置基本参数及密码。

“词语”是具体到某个词语的相关操作,比如建立新词,增加词间关系、个人注释、范畴、序号,以及高级检索和语种管理等。

“报告(Reports)”可以生成各种类型及各种格式的词表,词表类型包括:字顺表、词族索引、等级关系全显示的字顺表、范畴索引、轮排索引;词表的存储格式有:TXTCSV(逗号分隔值文件)、HTMLXML

“窗口(Window)”提供关闭和显示所有窗口的功能。

“帮助(Help)”包括帮助索引、软件基本信息和技术支持三个方面。

2.2 工具栏

工具栏是几个常用功能的快捷方式,包括下列功能:

词语检索(Search term)――提供单途径的精确检索,即系统根据检索词直接在主显示窗口中定位到该词所在位置。

高级检索(Adv Srch)――用于检索某个或一批词语,包括有精确检索、模糊检索,以及对标记、类目、状态、类型、序号、注释与否、范围注释、个人注释进行的检索。

重载(Rload)――刷新功能,也就是每次更新词表后,用来刷新显示主窗口中最新的词表信息。

建立新词(New term)――输入一个新词。

显示信息(Display)――显示某条叙词款目的详细管理信息,包括款目详细信息、多级显示、缩进式显示、编辑页面。

添加标记(Flag)――为某个词添加特定标记,范围从A-Z或是1-N,便于检索和管理叙词。

增加词间关系(Add rels)――为某个词添加与之有关的词间关系。

2.3 主窗口

主窗口用于显示已建立的每条叙词款目的概要信息,包括Term(词语)、Status(状态)、Type(类型)、Flag(标记)、Relationships(词间关系数)、Note(注释与否)、Categories(范畴,即类目)。主窗口具有直观方便的显示和浏览功能。对每条叙词款目的操作,用户除了选择菜单方式和点击快捷按扭外,也可以在主窗口中使用鼠标右键菜单,或是直接双击需要操作的某条叙词款目。

3  MultiTes的使用方法

3.1 建立新词表

必须打开菜单File 点击New,选择词表的存放地址,并输入词表名称,如:Chinese Paintings,这样就可以定义好一个新的空词表(如图1)。然后就可以建立新词,并增加词间关系,也可根据需要添加注释。其中叙词款目的输入既可以逐条录入,也可以整批导入数据。

3.2 增加词间关系

MultiTes自身为用户提供了一般叙词表通常规定的五种基本的词间关系(见表1),但是由于词间关系是丰富多彩的,因此MultiTes允许用户自己定义词间关系。这是它的一个重要特点,为网络环境中叙词表的发展提供了工具。

例如,在中国画词表中,根据有关中国画的叙词间的特有关系可以自定义四种关系(见表2):中国画按对象题材划分为(OBTONT)山水画、花鸟画、人物画;按制作技法划分为(TBTTNT)工笔画和写意画;除此之外,中国画还有两种普遍存在的关系就是:某某画家是某画派的代表人物(PBTPNT)、某某画派画家的代表作品(WBTWNT)有哪些?

1  Multites提供的基本词间关系

关系代码

 

关系类型

 

USE(用)

Use

等同

正式叙

UF(代)

Used For

等同

非正式叙词

BT(属)

Broader Term

等级

上位词

NT(分)

Narrower Term

等级

下位词

RT(参)

Related Term

相关

相关词

SN

Scope Note

注释

范围注释

SC

Subject Category

类别

范畴号

2  国画词表中自定义的四种词间关系

关系代码

 

对应关系

关系类型

 

OBT

按对象题材划分(上位词)

ONT

等级

O - Object

ONT

按对象题材划分(下位词)

OBT

等级

O - Object

TBT

按制作技法划分(上位词)

TNT

等级

T - Technique

TNT

按制作技法划分(下位词)

TBT

等级

T - Technique

PBT

代表人物(上位词)

PNT

等级

P - Person

PNT

代表人物(下位词)

PBT

等级

P - Person

WBT

代表作品(上位词)

WNT

等级

W - Work

WNT

代表作品(下位词)

WBT

等级

W - Work

在编制中国画词表时,就可以充分利用系统提供的和自定义的词间关系,将有关叙词联系起来。例如:

六朝三杰

BT:  绘画 流派

     PNT: 顾恺之  (代表人物)

          陆探微

          张僧

      SC: J209.9 绘画流派研究

 

顾恺之

      BT: 画家

     PBT: 六朝三杰

     WNT: 洛神赋 图 (代表作品)

          女史 图

      SC: K825.72 中国美术家、画家

中国 画

 UF: 国 画

     ONT: 花鸟 画 (按对象题材划分)

          人物 画

          山水 画

     TNT: 工笔 画 (按制作技法划分)

          写意 画

      RT: 画家

          绘画 流派

          中国 画 技法

          中国 画 作品

      SC: J222 中国画、中国画作品

 

3.3 增加主题范畴

主题范畴(Subject CategorySC是由MultiTes提供的一种词间关系,可以将叙词按照主题含义进行聚类。用户可以自行定义主题范畴类目表,或是采用已有的分类表。例如可以采用《中图法》第四版的类目,先在词表中增加一个主题范畴或类目“J222 中国画”,然后为叙词“中国画”增加词间关系“SC”,输入值为“J222”;这样“中国画”的范畴就为“J222 中国画”。当然,它还允许用户导入已有的主题类目表(即分类表),例如:

J209.9 绘画流派研究

  J212.1 中国画基本技法

   J212.25 中国人物画技法

   J212.26 中国山水画技法

   J212.27 中国花鸟画技法

       J222.3 魏、晋、南北朝中国画

J222.4 隋、唐中国画

J222.5 宋、元中国画

J222.6 明、清中国画

J222.7 现代中国画

K825.72 中国美术家、画家

3.4 快速编制叙词表

为了提高词表的编制效率,该软件提供了三种批量输入叙词的方式。包括快速输入数据,合并其他词表中的数据,以及导入已有词表,下面就简要介绍这三种方式。

1)快速输入数据。选择菜单Term 点击Quick dataentry,或直接使用快捷键Ctrl+Q,在输入框中以文本格式逐条输入叙词及词间关系。

2)合并其他词表中的数据。利用剪贴板(Edit -> Copy term record -> Paste term record),用户可以把其他MultiTes叙词表中的叙词款目复制到当前叙词表中,前提条件是两部叙词表中的关系代码相同,且处于同一计算机同一个文件目录下。对于粘贴的叙词款目可以通过Edit -> Show clipboard 来查看。这样就可以非常方便快速地对已有词表进行增加和更新了。

3)导入已有现成词表的有关部分。打开菜单File 点击Import...,打开已有的文本格式(采用系统默认的数据格式)的词表,导入到当前词表,并且根据用户自己的需要对词表进行编辑。

4  词表的生成和显示

编制好的叙词表,既可以按字顺排列,也可以按照词族索引的方式排列,既可以按照等级关系全显示的方式排列,也可以按照轮排索引的方式排列,从而输出的词表类型有:字顺表(等级关系单级显示)(Alphabetical,见表3)、等级关系全显示的字顺表(Hierarchical,见表4)、词族索引(Topterm,见表5)、范畴索引(Subject categories,见表6)、分类表(Classified)、轮排索引Rotated index,见表7)。

同时,MultiTes也为叙词表提供了多种输出格式(.TXT.CSV.HTML.XML),用户可以根据自己的需求进行选择。其中范畴索引、分类表和轮排索引只能生成文本格式。每种词表都可选择输出到打印机上,或是屏幕上。在输出词表时,用户可以对叙词及词间关系进行选择,也可对显示格式进行设置。有关输出设置的详细内容,笔者就不赘述,具体的操作用户可以自己体会。在此,只采用屏幕方式,并将部分输出结果作为参考进行呈现。

3  字顺表

二十八宿神形 图

             BT: 中国 画 作品

        WBT: 陆探微

                            SC: J222.3 魏、晋、南北朝中国画

                CN: 二十八宿神形 图

 

六朝三杰

           BT: 绘画 流派

       PNT: 顾恺之

            陆探微

            张僧

                    SC: J209.9 绘画流派研究

          CN: 六朝三杰

 

陆探微

      BT: 画家

         PBT: 六朝三杰

               WNT: 二十八宿神形 图

                         SC: K825.72 中国美术家、画家

        CN: 陆探微

 

中国 画

       UF: 国 画

        ONT: 花鸟 画

             人物 画

             山水 画

         TNT: 工笔 画

              写意 画

        RT: 画家

                绘画 流派

                   中国 画 技法

                   中国 画 作品

                           SC: J222 中国画、中国画作品

            CN: 中国 画

                    中国 画 作品

               UF: 国 画 作品

                    NT: 二十八宿神形 图

                  洛神赋 图

                  女史 图

          RT: 画家

                中国 画

                             SC: J222 中国画、中国画作品

             CN: 中国 画 作品

 

4  等级关系全显示的字顺表

二十八宿神形 图

        STA: Approved

          TYP: Descriptor

          INP: 2006-05-03

          UPD: 2006-05-10

  TNR: 38

            BT1: 中国 画 作品

     WBT1: 陆探微

   BT2: 画家

       PBT2: 六朝三杰

         BT3: 绘画 流派

                           SC: J222.3 魏、晋、南北朝中国画

 

六朝三杰

       STA: Approved

         TYP: Descriptor

         INP: 2006-05-03

         UPD: 2006-05-04

 TNR: 28

     PNT1: 顾恺之

        WNT2: 洛神赋 图

        WNT2: 女史 图

     PNT1: 陆探微

             WNT2: 二十八宿神形 图

     PNT1: 张僧

         BT1: 绘画 流派

                   SC: J209.9 绘画流派研究

 

陆探微

      STA: Approved

         TYP: Descriptor

         INP: 2006-05-03

         UPD: 2006-05-04

 TNR: 31

            WNT1: 二十八宿神形 图

   BT1: 画家

      PBT1: 六朝三杰

        BT2: 绘画 流派

                       SC: K825.72 中国美术家、画家

 

中国 画

      STA: Approved

        TYP: Descriptor

        INP: 2006-05-02

        APP: 2006-05-02

        UPD: 2006-05-10

TNR: 1

   UF: 国 画

   ONT1: 花鸟 画

   ONT1: 人物 画

   ONT1: 山水 画

   TNT1: 工笔 画

   TNT1: 写意 画

      TNT2: 大 写意 画

      TNT2: 小 写意 画

  RT: 画家

           绘画 流派

             中国 画 技法

             中国 画 作品

                     SC: J222 中国画、中国画作品

 

5  词族索引

中国画 技法

. 白描

. 颤笔

. 皴法

. 干笔

. 工笔

. 钩勒

. 积墨

. 减笔

. 落墨

. 没骨

. 泼墨

. 破墨

. 湿笔

. 双钩

. 宿墨

.   线画法

. 写意

 

6  范畴索引

J209.9 绘画流派研究

 

J212.1 中国画基本技法

J212.25 中国人物画技法

J212.26 中国山水画技法

J212.27 中国花鸟画技法

 

J222 中国画、中国画作品

J222.3 魏、晋、南北朝中国画

J222.4 隋、唐中国画

J222.5 宋、元中国画

J222.6 明、清中国画

J222.7 现代中国画

 

K825.72 中国美术家、画家

 

7  轮排索引

               大 写意 画

             工笔 画

           国 画

               国 画 作品

             花鸟 画

             人物 画

             山水 画

               小 写意 画

             写意 画

             中国 画

                 中国 画 技法

                 中国 画 作品

 

5  结束语

笔者尝试利用机编词表软件MultiTes,模拟编制了一部有关中国画的小型叙词表,通过网络和凭经验选词,采用中文语种;该词表收录了与中国画相关的叙词(包括正式叙词、非正式叙词、族首词)、主题类目(范畴),并自定义了四种词间关系,在此基础上设置参照(包括等级关系、等同关系、相关关系)。由于笔者编制的词表比较简单,而且选用的词语和自定义的词间关系都需要进一步商榷,因此文中所有的例子只是用来说明该软件某项功能,仅供读者参考。

根据机读叙词表的评价标准[4],MultiTes的优点在于:能够动态显示款目词及款目词的相关信息,即具有显示信息及时性和词表各部分修改的连动性;系统对词间关系的管理灵活且周到,也就是说用户既可以直接使用预先定义好的关系,也可以自定义词间关系。词表数据的输入具有较好的一致性,包括词间关系的互逆性控制、唯一性控制、完整性控制和越级关系控制。系统支持多种类型词表的多种输出形式(文本文件和特殊格式文件),极大地满足了用户的需要。

但是MultiTes仍然存在不足之处:系统不支持单屏多窗口同时显示几个或全部索引表,因而不能实现表间互联显示。词间关系的代码过于抽象,不易识别,尤其是自定义很多词间关系后,在等级显示的字顺表中,就会造成词表结构庞大复杂,直观性差,由此可见系统缺少词间关系结构的可视化显示方式。系统输出的XML格式目前不支持中文。

 

参考文献

1  http://www.multites.com/

2  http://www.kmconnection.com/pguide/KSP2000316.htm

3  http://www.kmconnection.com/pguide/KSP2000238.htm

4 戴维民,赵建华,汪东坡.面向21世纪的情报语言学.北京图书馆出版社,2000

5 侯汉清,戴维民,陆宝树.情报检索词汇控制.同济大学出版社,1992

6 朱岩.开发机读词表功能的研究.情报理论与实践,19931

 

*本论文得到国家社会科学基金项目(05BTQ021)的资助。

 

杨俊梅  1983年生,南京农业大学信息管理系,硕士研究生,方向为信息组织。

    1976年生,南京农业大学信息管理系硕士研究生,方向为信息组织。

侯汉清  1943年生,南京农业大学信息管理系教授、博士生导师,中国索引学会副理事长。