信息化环境下主题标引误差分析及对策研究
东 方
(衡阳师范学院图书馆 湖南衡阳 421008)
摘 要 列举信息化环境下主题标引常见误差的表现,并就如何减少主题标引过程中的误差提出相应的对策。
关键词 主题标引 误差分析
信息化环境的形成使得图书馆业务流程发生重大的变化,其中的一个趋向是开展联机编目。如何更有效地根据文献所论述的内容赋予文献恰当的主题词,是建立文献检索系统、实现有效而快速的文献检索所必须解决的首要问题。本文结合工作实践,对主题标引工作中常见的误差及其相应的对策问题进行探讨。
1 信息化环境下主题标引评价标准
1.1 主题标引要全面、准确、一致
信息化环境下衡量文献主题标引质量的主要标准是全面、准确、一致;同时也是主题标引工作的基本要求。信息时代计算机技术的发展、联机检索功能的不断完善,为全面揭示文献内容提供了越来越便利的条件,也对全面地标引文献提出了更高的要求――把文献中有价值的多个主题或某一主题的多个方面,甚至隐含主题充分地揭示出来。标引越充分,检索点就越多,也就可能使读者从不同的角度检索到所需文献,提高查全率。在做到主题标引全面的同时,还要追求准确;“全面”与“准确”应是相辅相成、相互依赖的。在正确分析主题、提炼主题的基础上,要控制好标引深度,选用专指的主题词,标引人员对同一篇文献或相同主题的文献赋予检索标识时要做到前后一致。只有做到全面、准确、一致,才能提高查全率和查准率,进而提高检索效率。
1.2 主题标引要方便用户使用
信息化环境下高质量的主题检索系统,除应满足用户“查全”、“查准”要求外,还应能让用户既方便又快捷地完成检索过程。为实现这一目标,最重要的就是要研究、了解用户的检索习惯,在不违背主题标引规则的前提下,力求使主题标引能适合用户的检索思路和检索方式。例如,可适当运用非控主题词。利用计算机网络进行情报检索的大部分用户并不熟悉主题词表经过人工控制后的选词及词间关系,也不了解复杂的标引技术及标引规则。因此,适当增加一些非控主题词对于方便用户检索很有意义。
2 目前常见主题标引误差分析
2.1 文献主题概念仅限于文献题名,漏标局部主题
在分析主题概念时,如果不依据文献内容获取主题概念,只凭借题名所含概念选择主题词,就会漏标文献的局部主题,出现标引误差。例如,《电脑万用入门培训教程》一书,内容包括Windows98的基本操作、Wps2000与Word2000的操作技术、上网操作技术及电脑维护等内容,较多图书馆编目部门将此书标引成:电子计算机―基本知识,这样标引漏标了有较大检索价值的局部主题,如Windows98、Wps2000、Word2000等,读者很难从“电子计算机”这一主题找到自己所需文献,这样既不能充分揭示文献的主题内容,也不能向读者提供更多的检索点,其结果必然会造成漏检。
2.2 忽略文献的隐含主题
所谓隐含主题,是不同于原有文献线性结构所表述的主题因素概念属性的结构体,是隐含于线性关系中的非线性关系。标引人员在进行标引时,往往稍不留神就会漏掉文献中隐含的主题概念。由于隐含主题具有隐含性、模糊性等特点,一般难以分析与确定,需要通过深入了解文献的主题内容才能被挖掘出来。某些标引人员却忽略了含有重要信息的隐含主题的标引,如《经济学家之路》第一辑,介绍了经济学家的成长道路及他们在学术上的贡献,许多图书馆对该书只标引其显性主题:经济学家―生平事迹―中国―现代,对其隐含主题:经济学家―经济思想,没有作进一步揭示。
2.3 文献主题概念提炼错误、不全或过多而引起错标、漏标或过度标引
主题概念提炼错误是指从文献中分析和提炼出的主题概念与原文献不相符合。这种现象将引起错标,导致错检、漏检,影响文献的查全率和查准率;主题概念提炼不全是指从文献中分析和提炼出的主题概念少于原文献提供的主题概念,从而影响文献的查全率;主题概念提供过多是指从文献中分析和提炼出的主题概念多于原文献提供的主题概念,把没有价值或不符合具体检索系统要求的主题概念提炼了出来,这会引起过度标引,导致错检。例如,《用氩离子激光器的高速、高精度平版印刷》一书,主要内容是侧重于应用问题,而不是讲印刷设备,所以若标引成:离子激光器、印刷设备,则就是主题概念提炼错误而引起的错标,正确标引是:半导体器件、光刻、激光扫描、离子激光器。
3 尽量减少标引误差,提高主题标引质量
3.1 首要的是不断提高文献标引人员的专业知识水平和素质
要想提高主题标引的质量,首先得不断提高标引人员的专业知识水平。因为主题标引工作的专业性和技术性较强,标引人员的素质对提高标引质量至关重要。一方面,每个标引人员都必须掌握标引的基本知识,充分了解主题词表的体系结构,熟练运用相应的标引方法和规则。另一方面,标引人员要具备广博的学科知识和较专的相关学科知识,如具备一定的计算机知识和外语水平,同时对与编目工作有关的各个知识领域的研究对象、学科分支及新学科、新技术等,也要适当了解,以便在具体的标引工作中正确把握文献的主题,把文献的主题恰到好处地表达出来。
3.2 分析主题结构,确定标引次序
标引次序问题对于提高主题标引质量也很重要。刘湘生先生在1981年就提出将全部主题概括为5个基本因素,即主体因素、通用因素、位置因素、时间因素、文献类型因素。其中主体因素为词表中具有独立检索意义的主题概念,通用因素指只起修饰作用的一般概念,如方法、规划等,后三种因素则为时间、地点、文献类型等的限定。他认为在这5种因素中,主体因素是关键,其他为辅助性因素,并分别将它们标示为:A、主体因素,B、通用因素,C、位置因素,D、时间因素,E、文献类型因素,并最终确定其标引顺序为:ABCDE。目前,刘湘生的中文标引次序已被确定为我国文献主题标引的国家标准而加以推广使用,我们在实际标引工作中也依据这一标准。因此,标引人员在标引实践中要根据这一理论和规则注意标引的次序问题。如文献《中国企业进出口贸易手册》的标引次序应为:企业经济―对外贸易―中国―手册。
3.3 正确进行主题词的组配标引
我们在进行主题标引时,常常会碰到主题比较复杂的文献。在标引时只用一个主题词是难以反映出主题的深度和广度的,需要通过一定的规则,把两个或更多的主题词组合起来,表达一个复杂的主题概念,这就是组配标引。组配标引能以较少的主题词完整确切地表达主题概念,提高标引的专指性,并提高检索效率;其关键在于解决好主题词之间的组配问题。那么怎样正确进行主题词的组配呢?我们应该遵循一定的规则。
常见的主题词组配规则有:(1)主题词的组配必须是概念组配而不是字面组配。也就是说,组配的主题词之间,在概念上必须是相容的,有着概念限定或概念交叉的关系。(2)当表达一个复杂主题概念有几种组配形式可选择时,应优先采用交叉组配法(其组配符号一般采用冒号“:”);只有不能进行交叉组配时,才可使用限定组配法(其组配符号一般采用短横“―”)。因为交叉组配表达的主题概念比限定组配表达的主题概念专指性更强,若忽略了这点,就会造成误差。(3)无论用交叉组配还是用限定组配,必须选用最专指的主题词进行组配,不得用更泛指的词组配。只有查不到合适的专指词时,才允许用泛指主题词组配。(4)不得越级组配。即当有相应的专指主题词可用来组配时,不得使用该词的上位词或下位词组配,以避免越级组配。(5)对于具有矛盾关系、反对关系的主题词,不得进行相互交叉组配或限定组配。(6)对于文献中并列的多主题,应按单主题分组进行组配。即要将多主题先分解为单主题,再按单主题之间的关联情况分组组配。(7)组配的词序,应以《文献主题款目规则》中关于主题构成因素及其序列:“主体因素―通用因素―位置因素―时间因素―文献类型因素”作为组配次序的基本依据。(8)选词组配过程中,常因词表中以用代关系所指引的正式主题词的概念外延与所代词外延不能完全重合,无法用来组配或组配后概念尚不能完全明确,这时,应另选适合的主题词或辅助词加以补充。(9)避免用不必要的词进行堆砌。囿于篇幅,笔者未能就以上每条规则逐一举例,现结合一个典型例子加以说明。“银行会计原理”这一主题,若标引为“会计―理论”或“人民银行会计―理论”均属错误标引,因为“会计”是“银行会计”的上位词,而“人民银行会计”则是银行会计的下位词,故上述标引都属越级组配。正确标引应该是“银行会计―理论”。
3.4 注意综合运用各种标引技巧
在进行文献主题标引时,通常可采用两种方法:一种是直接标引,一种是间接标引。前者适用于可直接从选定的词表中找到相同主题概念叙词的情况;后者适用于叙词表中找不到与文献主题概念相匹配的叙词的情况。在实际标引中,经常遇到的文献大多需间接标引,常见的标引技巧有:增词标引,即增加主题词表上没有的新主题词标引;增意标引,即对标引概念增添含义的标引方案;减意标引,即减去标引概念中某些含义的标引方案;近义标引,即采用一些近义主题概念进行标引的方案。如“线圈的磁特性”很容易被标引成“线圈”和“磁特性”,其实根据增意标引规则,应标引成“层式线圈”而不能只标引成“线圈”。笔者现结合自己在图书馆的标引实践加以说明。衡阳师范学院图书馆使用的是ILASII自动化集成管理系统,通过较长时间的操作,发现ILASII系统在运用标引技巧方面具有显著优点,但也存在某些不足。首先,ILASII在主题标引字段(除690字段)的6字段的设置是比较合理的,均符合CNMARC格式,为资源共享打下了良好基础。其次,ILASII利用计算机设置在主题途径检索的状态下,只要输入相关主题词,就可以检索到与主题检索有关的全部文献,减少了差错率与漏检率,增加了检索途径。另外,606学科主题字段中的@a,@b,@c不需要轮排,均可做检索入口词。当然,它也还有不足之处,如606学科主题字段中@b,@c的设置与CNMARC格式不符,ILAS系统的主题字段中@x,@y,@z均无检索意义,不能同时给出多个检索入口词。我们在实践中逐渐加以完善,以提高主题标引的质量。
3.5 加强宏观管理,进行规范控制
要减少主题标引的误差,除了要提高标引人员的素质外,还必须对主题标引的全过程进行科学的组织和有效的质量管理。首先,各馆可根据具体情况制定详细、明确的标引工作细则,作为标引质量控制的依据。其次,做好定额管理。工作人员完成定额时还要加强标引质量的控制,摒弃片面追求标引数量的做法,合理地规定编目人员的标引定额标准。第三,还要建立质量检查制度。高质量的校对也是控制主题标引质量的重要环节,要严把校对关,建立质量检查制度,开展群众性的质量检查工作。最后,进行规范控制。目前,我国国内大多数图书馆还没有机读主题规范数据库。在实际工作中,利用现有条件把工作中遇到的或回溯到的一些与规范有关的数据,用卡片形式组成卡片规范控制文档,这样既规范了当前的记录,又为今后转化为机读规范文档准备了资源。通过规范控制,可以把各种各样的非正式主题标识指引到正式主题标识,从而使读者从不同的途径均能检索到相同的文献。
综上所述,为了减少主题标引的误差、提高主题标引的质量,笔者建议采取以上措施。但是,在标引过程中由于会有很多预料不到的问题出现,因而需要标引人员认真研究标引技术,熟练掌握标引方法和技巧,使标引工作更加标准化、规范化。
参考文献
1 张琪玉.情报语言学基础.武汉:武汉大学出版社,1997
2 刘湘生,汪东波.文献标引工作.北京:北京图书馆出版社,2001
3 郑 宇.如何提高主题标引的质量.图书情报工作,2003(7):73-76
4 李育嫦.当前文献主题标引存在的问题与解决方法.图书馆学、信息科学、资料工作,2003(2):67-69
5 蒋福兰.浅议网络环境下文献主题标引工作.江西图书馆学刊,2003,33(1):36-37
6 赵秀姣.标引误差分析.河南图书馆学刊,2003,23(2):66-67
7 吴文慧.利用图书馆自动化集成系统进行主题标引之我见.江西图书馆学刊,2002,32(3):28-29
8 刘建立.论主题标引中的次序问题.高校图书馆工作,2002,22(3):41-43
9 张改侠.主题标引中主题词的组配规则.图书情报知识,2003(3):61-62
东 方 女 1973年生,毕业于西南师范大学图书馆学专业,湖南衡阳师范学院图书馆馆员。已发表论文10篇。