简便易行的机编词表软件――MultiTes*
杨俊梅 刘 俊 侯汉清
(南京农业大学信息管理系 210095)
摘 要 在实际使用的基础上,本文介绍一种国外流行的、简便易用的机编词表软件――MultiTes 2005 Pro。作者详述了该软件的主要功能、结构、界面和使用方法,并进行了简要的评价。
关键词 电子叙词表 叙词表编制 词表编制软件 MultiTes
1 MultiTes的功能及特点
MultiTes 2005 Pro[1]是由Multisystems公司推出的叙词表编制软件MultiTes的最新版本。Multisystems于1983年采用dBaseII编程语言开发了第一种叙词表管理计算机软件,起初这种软件只有单机版[2]。经过不断的创新,MultiTes 2005 Pro无论在单机环境下还是网络环境下,都能够非常方便地编制、浏览和维护叙词表、分类表及其他类型的受控词表[1][3],并且它允许用户管理一系列术语列表、叙词表、标题表、分类表、多级叙词表、范畴索引和多语种叙词表[3]。MultiTes 2005 Pro的主要功能和特点包括有:
・支持美国标准学会(ANSI)和美国国家信息标准化组织(NISO)制定的关于受控词表编制的新的国家标准,包括词间关系(用、代、属、分、参等)的规定,允许用户自定义词间关系、范畴、语种和注释等。
・支持叙词表等级关系的单级显示和全显示(即显示叙词的各级上下位词)。
・支持多语种词表。
・在两词之间建立关系时,系统对逻辑错误的词间关系具有自动报错功能。
・自动生成叙词间的对应关系。
・对词表中的叙词数量、词间关系的类型、类目等级和规模皆没有限制(除了受到计算机本身内存大小的限制)。
・多种数据导入方式:利用自由文本模板快速输入数据、通过剪贴板拷贝/粘贴数据、在同一台计算机上不同词表间拷贝数据。
・高级检索可以提供叙词词串、注释内容、类别、标记、状态和类型等的检索。
・输出多种类型词表:包括字顺表、词族索引、等级关系全显示的字顺表、范畴索引、轮排索引等。
・输出多种格式词表:包括TXT、CSV(逗号分隔值文件)、HTML、XML等。
2 MultiTes的结构和界面图1 Multites的主界面
2.1 菜单栏
菜单栏的系统功能可以通过下拉菜单方式实现:
“文件(File)”是对词表的基本操作,比如新建、打开、关闭、备份、导入一个文件或显示词表信息等。“编辑(Edit)”可以实现对叙词款目进行各种操作,比如复制、粘贴、剪贴板、编辑词语、删除、标记的添加和移除等。
“定义(Define)”允许用户自定义词间关系、范畴、语种,设置基本参数及密码。
“词语”是具体到某个词语的相关操作,比如建立新词,增加词间关系、个人注释、范畴、序号,以及高级检索和语种管理等。
“报告(Reports)”可以生成各种类型及各种格式的词表,词表类型包括:字顺表、词族索引、等级关系全显示的字顺表、范畴索引、轮排索引;词表的存储格式有:TXT、CSV(逗号分隔值文件)、HTML、XML。
“窗口(Window)”提供关闭和显示所有窗口的功能。
“帮助(Help)”包括帮助索引、软件基本信息和技术支持三个方面。
2.2 工具栏
工具栏是几个常用功能的快捷方式,包括下列功能:
词语检索(Search term)――提供单途径的精确检索,即系统根据检索词直接在主显示窗口中定位到该词所在位置。
高级检索(Adv Srch)――用于检索某个或一批词语,包括有精确检索、模糊检索,以及对标记、类目、状态、类型、序号、注释与否、范围注释、个人注释进行的检索。
重载(Rload)――刷新功能,也就是每次更新词表后,用来刷新显示主窗口中最新的词表信息。
建立新词(New term)――输入一个新词。
显示信息(Display)――显示某条叙词款目的详细管理信息,包括款目详细信息、多级显示、缩进式显示、编辑页面。
添加标记(Flag)――为某个词添加特定标记,范围从A-Z或是1-N,便于检索和管理叙词。
增加词间关系(Add rels)――为某个词添加与之有关的词间关系。
2.3 主窗口
主窗口用于显示已建立的每条叙词款目的概要信息,包括Term(词语)、Status(状态)、Type(类型)、Flag(标记)、Relationships(词间关系数)、Note(注释与否)、Categories(范畴,即类目)。主窗口具有直观方便的显示和浏览功能。对每条叙词款目的操作,用户除了选择菜单方式和点击快捷按扭外,也可以在主窗口中使用鼠标右键菜单,或是直接双击需要操作的某条叙词款目。
3 MultiTes的使用方法
3.1 建立新词表
必须打开菜单File 点击New,选择词表的存放地址,并输入词表名称,如:Chinese Paintings,这样就可以定义好一个新的空词表(如图1)。然后就可以建立新词,并增加词间关系,也可根据需要添加注释。其中叙词款目的输入既可以逐条录入,也可以整批导入数据。
3.2 增加词间关系
MultiTes自身为用户提供了一般叙词表通常规定的五种基本的词间关系(见表1),但是由于词间关系是丰富多彩的,因此MultiTes允许用户自己定义词间关系。这是它的一个重要特点,为网络环境中叙词表的发展提供了工具。
例如,在中国画词表中,根据有关中国画的叙词间的特有关系可以自定义四种关系(见表2):中国画按对象题材划分为(OBT和ONT)山水画、花鸟画、人物画;按制作技法划分为(TBT和TNT)工笔画和写意画;除此之外,中国画还有两种普遍存在的关系就是:某某画家是某画派的代表人物(PBT和PNT)、某某画派画家的代表作品(WBT和WNT)有哪些?
表1 Multites提供的基本词间关系
关系代码 | 描 述 | 关系类型 | 备 注 |
USE(用) | Use | 等同 | 正式叙词 |
UF(代) | Used For | 等同 | 非正式叙词 |
BT(属) | Broader Term | 等级 | 上位词 |
NT(分) | Narrower Term | 等级 | 下位词 |
RT(参) | Related Term | 相关 | 相关词 |
SN | Scope Note | 注释 | 范围注释 |
SC | Subject Category | 类别 | 范畴号 |
表2 国画词表中自定义的四种词间关系
关系代码 | 描 述 | 对应关系 | 关系类型 | 备 注 |
OBT | 按对象题材划分(上位词) | ONT | 等级 | O - Object |
ONT | 按对象题材划分(下位词) | OBT | 等级 | O - Object |
TBT | 按制作技法划分(上位词) | TNT | 等级 | T - Technique |
TNT | 按制作技法划分(下位词) | TBT | 等级 | T - Technique |
PBT | 代表人物(上位词) | PNT | 等级 | P - Person |
PNT | 代表人物(下位词) | PBT | 等级 | P - Person |
WBT | 代表作品(上位词) | WNT | 等级 | W - Work |
WNT | 代表作品(下位词) | WBT | 等级 | W - Work |
在编制中国画词表时,就可以充分利用系统提供的和自定义的词间关系,将有关叙词联系起来。例如:
六朝三杰 BT: 绘画 流派 PNT: 顾恺之 (代表人物) 陆探微 张僧繇 SC: J209.9 绘画流派研究 顾恺之 BT: 画家 PBT: 六朝三杰 WNT: 洛神赋 图 (代表作品) 女史箴 图 SC: K825.72 中国美术家、画家 | 中国 画 UF: 国 画 ONT: 花鸟 画 (按对象题材划分) 人物 画 山水 画 TNT: 工笔 画 (按制作技法划分) 写意 画 RT: 画家 绘画 流派 中国 画 技法 中国 画 作品 SC: J222 中国画、中国画作品 |
3.3 增加主题范畴
主题范畴(Subject Category,SC)是由MultiTes提供的一种词间关系,可以将叙词按照主题含义进行聚类。用户可以自行定义主题范畴类目表,或是采用已有的分类表。例如可以采用《中图法》第四版的类目,先在词表中增加一个主题范畴或类目“J222 中国画”,然后为叙词“中国画”增加词间关系“SC”,输入值为“J222”;这样“中国画”的范畴就为“J222 中国画”。当然,它还允许用户导入已有的主题类目表(即分类表),例如:
J209.9 绘画流派研究
J212.1 中国画基本技法
J212.25 中国人物画技法
J212.26 中国山水画技法
J212.27 中国花鸟画技法
J222.3 魏、晋、南北朝中国画
J222.4 隋、唐中国画
J222.5 宋、元中国画
J222.6 明、清中国画
J222.7 现代中国画
K825.72 中国美术家、画家
3.4 快速编制叙词表
为了提高词表的编制效率,该软件提供了三种批量输入叙词的方式。包括快速输入数据,合并其他词表中的数据,以及导入已有词表,下面就简要介绍这三种方式。
(1)快速输入数据。选择菜单Term 点击Quick dataentry,或直接使用快捷键Ctrl+Q,在输入框中以文本格式逐条输入叙词及词间关系。
(2)合并其他词表中的数据。利用剪贴板(Edit -> Copy term record -> Paste term record),用户可以把其他MultiTes叙词表中的叙词款目复制到当前叙词表中,前提条件是两部叙词表中的关系代码相同,且处于同一计算机同一个文件目录下。对于粘贴的叙词款目可以通过Edit -> Show clipboard 来查看。这样就可以非常方便快速地对已有词表进行增加和更新了。
(3)导入已有现成词表的有关部分。打开菜单File 点击Import...,打开已有的文本格式(采用系统默认的数据格式)的词表,导入到当前词表,并且根据用户自己的需要对词表进行编辑。
4 词表的生成和显示
编制好的叙词表,既可以按字顺排列,也可以按照词族索引的方式排列,既可以按照等级关系全显示的方式排列,也可以按照轮排索引的方式排列,从而输出的词表类型有:字顺表(等级关系单级显示)(Alphabetical,见表3)、等级关系全显示的字顺表(Hierarchical,见表4)、词族索引(Topterm,见表5)、范畴索引(Subject categories,见表6)、分类表(Classified)、轮排索引(Rotated index,见表7)。
同时,MultiTes也为叙词表提供了多种输出格式(.TXT、.CSV、.HTML、.XML),用户可以根据自己的需求进行选择。其中范畴索引、分类表和轮排索引只能生成文本格式。每种词表都可选择输出到打印机上,或是屏幕上。在输出词表时,用户可以对叙词及词间关系进行选择,也可对显示格式进行设置。有关输出设置的详细内容,笔者就不赘述,具体的操作用户可以自己体会。在此,只采用屏幕方式,并将部分输出结果作为参考进行呈现。
表3 字顺表
二十八宿神形 图
BT: 中国 画 作品
WBT: 陆探微
SC: J222.3 魏、晋、南北朝中国画
CN: 二十八宿神形 图
六朝三杰
BT: 绘画 流派
PNT: 顾恺之
陆探微
张僧繇
SC: J209.9 绘画流派研究
CN: 六朝三杰
陆探微
BT: 画家
PBT: 六朝三杰
WNT: 二十八宿神形 图
SC: K825.72 中国美术家、画家
CN: 陆探微
中国 画
UF: 国 画
ONT: 花鸟 画
人物 画
山水 画
TNT: 工笔 画
写意 画
RT: 画家
绘画 流派
中国 画 技法
中国 画 作品
SC: J222 中国画、中国画作品
CN: 中国 画
中国 画 作品
UF: 国 画 作品
NT: 二十八宿神形 图
洛神赋 图
女史箴 图
RT: 画家
中国 画
SC: J222 中国画、中国画作品
CN: 中国 画 作品
表4 等级关系全显示的字顺表
二十八宿神形 图
STA: Approved
TYP: Descriptor
INP: 2006-05-03
UPD: 2006-05-10
TNR: 38
BT1: 中国 画 作品
WBT1: 陆探微
BT2: 画家
PBT2: 六朝三杰
BT3: 绘画 流派
SC: J222.3 魏、晋、南北朝中国画
六朝三杰
STA: Approved
TYP: Descriptor
INP: 2006-05-03
UPD: 2006-05-04
TNR: 28
PNT1: 顾恺之
WNT2: 洛神赋 图
WNT2: 女史箴 图
PNT1: 陆探微
WNT2: 二十八宿神形 图
PNT1: 张僧繇
BT1: 绘画 流派
SC: J209.9 绘画流派研究
陆探微
STA: Approved
TYP: Descriptor
INP: 2006-05-03
UPD: 2006-05-04
TNR: 31
WNT1: 二十八宿神形 图
BT1: 画家
PBT1: 六朝三杰
BT2: 绘画 流派
SC: K825.72 中国美术家、画家
中国 画
STA: Approved
TYP: Descriptor
INP: 2006-05-02
APP: 2006-05-02
UPD: 2006-05-10
TNR: 1
UF: 国 画
ONT1: 花鸟 画
ONT1: 人物 画
ONT1: 山水 画
TNT1: 工笔 画
TNT1: 写意 画
TNT2: 大 写意 画
TNT2: 小 写意 画
RT: 画家
绘画 流派
中国 画 技法
中国 画 作品
SC: J222 中国画、中国画作品
表5 词族索引
中国画 技法
. 白描
. 颤笔
. 皴法
. 干笔
. 工笔
. 钩勒
. 积墨
. 减笔
. 落墨
. 没骨
. 泼墨
. 破墨
. 湿笔
. 双钩
. 宿墨
. 线画法
. 写意
表6 范畴索引
J209.9 绘画流派研究
J212.1 中国画基本技法
J212.25 中国人物画技法
J212.26 中国山水画技法
J212.27 中国花鸟画技法
J222 中国画、中国画作品
J222.3 魏、晋、南北朝中国画
J222.4 隋、唐中国画
J222.5 宋、元中国画
J222.6 明、清中国画
J222.7 现代中国画
K825.72 中国美术家、画家
表7 轮排索引
画
大 写意 画
工笔 画
国 画
国 画 作品
花鸟 画
人物 画
山水 画
小 写意 画
写意 画
中国 画
中国 画 技法
中国 画 作品
5 结束语
笔者尝试利用机编词表软件MultiTes,模拟编制了一部有关中国画的小型叙词表,通过网络和凭经验选词,采用中文语种;该词表收录了与中国画相关的叙词(包括正式叙词、非正式叙词、族首词)、主题类目(范畴),并自定义了四种词间关系,在此基础上设置参照(包括等级关系、等同关系、相关关系)。由于笔者编制的词表比较简单,而且选用的词语和自定义的词间关系都需要进一步商榷,因此文中所有的例子只是用来说明该软件某项功能,仅供读者参考。
根据机读叙词表的评价标准[4],MultiTes的优点在于:能够动态显示款目词及款目词的相关信息,即具有显示信息及时性和词表各部分修改的连动性;系统对词间关系的管理灵活且周到,也就是说用户既可以直接使用预先定义好的关系,也可以自定义词间关系。词表数据的输入具有较好的一致性,包括词间关系的互逆性控制、唯一性控制、完整性控制和越级关系控制。系统支持多种类型词表的多种输出形式(文本文件和特殊格式文件),极大地满足了用户的需要。
但是MultiTes仍然存在不足之处:系统不支持单屏多窗口同时显示几个或全部索引表,因而不能实现表间互联显示。词间关系的代码过于抽象,不易识别,尤其是自定义很多词间关系后,在等级显示的字顺表中,就会造成词表结构庞大复杂,直观性差,由此可见系统缺少词间关系结构的可视化显示方式。系统输出的XML格式目前不支持中文。
参考文献
1 http://www.multites.com/
2 http://www.kmconnection.com/pguide/KSP2000316.htm
3 http://www.kmconnection.com/pguide/KSP2000238.htm
4 戴维民,赵建华,汪东坡.面向21世纪的情报语言学.北京图书馆出版社,2000
5 侯汉清,戴维民,陆宝树.情报检索词汇控制.同济大学出版社,1992
6 朱岩.开发机读词表功能的研究.情报理论与实践,1993(1)
*本论文得到国家社会科学基金项目(05BTQ021)的资助。
杨俊梅 1983年生,南京农业大学信息管理系,硕士研究生,方向为信息组织。
刘 俊 1976年生,南京农业大学信息管理系硕士研究生,方向为信息组织。
侯汉清 1943年生,南京农业大学信息管理系教授、博士生导师,中国索引学会副理事长。