以用户为中心完善中图分类法的若干建议
钟瑛
(中国科技信息研究所 北京万方数据股份有限公司 北京 100038)
摘 要 中图分类法作为文献信息的基本组织方法在数字图书馆中得到广泛应用。然而,当越来越多的文献信息通过网络传播,信息种类和数量呈爆炸式增长,中图分类法已经不能完全满足组织和管理文献信息的需要;网络用户作为文献信息利用的主体,由于知识背景、使用习惯与传统用户不同,无法有效使用该分类法发现和搜集信息。在信息爆炸与有效信息短缺并存,图书馆服务功能凸显的时代,中图分类法必须完善。建议以最终用户为中心,兼顾管理者的需要,通过调整类目、选择词汇、强化技术完善分类法,使之更好地指导数字图书馆的建设和维护。
关键词 中图分类法 分众分类法 用户中心 领域 行业分类 实时更新
1 中图法在数字图书馆中的应用情况
图书馆文献资源丰富集中,为了比较科学、系统地进行管理,必须按照一定的方法进行组织。不同时代和不同国家采用的分类法有所差异,但指导思想是一致的:即按照科学分类的基本原则,将某一专业门类的图书与特定序号联系起来,从而对全部图书资料进行科学组织。分类法一方面能够合理揭示图书资料的内在联系;另一方面也是指导图书管理员进行库架排位的依据。《中国图书馆分类法》(原称《中国图书馆图书分类法》)是我国建国后编制出版的一部具有代表性的大型综合性分类法,是当今国内图书馆使用最广泛的分类法体系,简称《中图法》[①]。
用户学习了这部分类法的有关知识,就能够迅速、有效地查寻全国各图书馆的馆藏;而一旦灵活掌握了这部分类法的有关知识,还能够居高临下,洞察某知识点在专业学科系统中的位置、关系、渊源;能够灵活进行文献的扩检和缩检;能够系统学习某些专题文献;通过分类号的引导,还有助于对陌生专业文献内容的理解。
然而,随着数字图书馆的兴起和广泛使用,由于用户群体的扩大、用户类型的丰富,中图法在应用中出现了一些不足[②],与用户使用习惯之间的矛盾日益显著。
这些缺陷和矛盾可以总结为以下两个方面:
第一, 分类法受到制定者的知识能力和知识更新速度的限制[③]。
第二, 事物的发展快过制定者的知识能力和知识更新速度。
第三, 大部分网络用户不能完全掌握分类法,也不愿意完整地学习分类法。
就第一个方面而言,中图分类法是以制定者,也就是学科专家的智慧和知识为依据的。通过主题词和分类法的对应,对图书资料中出现的叙词和主题词(规范的叙词)进行统计,在此基础上,专家分类而形成的一种相对科学的方法。在分类准确、分类主题词准确这两个前提下,才有图书资料查全与查准的理论关系。而实际上专家无法穷举所有的叙词,统计基础就存在误差。更进一步地说,专家并不真正了解整个图书资料所描述的内容,或者受自身专业知识的限制,会发生错分类的情况,造成分类不准确的结果。中图法现存的类目规范化问题、多重列类、类表冗余、分类排架用号与分类检索用号使用方法相矛盾等问题,以及某些类目或缺乏必要的注释,或注释描述不够规范,或注释设置重复等问题都可以归于此类。
第二个方面的问题更加明显。分类法编制耗时,成果滞后是客观现象。尤其是网络时代传播的快速度和互联网信息爆炸性的增长,主题词的变化和更新速度的不匹配,放大了主题词的非实时性不足,加深了叙词规范的滞后性。中图法中出现的诸多问题都与此相关:例如类目体系滞后;类名不通俗,社会生活和文化生活方面的文献内容时效性强,多为通俗化、生活化、娱乐性内容,而类名多为传统学科划分的和学术化的,不能适应这些主题文献的分类需要;类目概念过时、限定过窄;类目深度控制不妥当,与经济生活发展密切相关的主题等类均存在类目设置过粗问题,有些类目又存在设置过细、使用率较低或基本未使用的问题。
第三方面问题则与整个社会的发展相关。很长一段时间里,图书馆和情报检索系统是一个专家系统,图书馆工作人员和情报检索人员都是专业人士,能够通过统一的分类法查找、利用和分享文献资料。但是,随着图书馆和情报检索机构日益社会化,其大众服务价值被不断发掘,越来越多的人们开始进入到图书馆和情报检索机构。尤其是数字图书馆的浪潮,使得网络终端用户成为图书馆使用者的主要组成部分。而这些网络用户的使用习惯与专业使用者的习惯有很大差别。
传统文献分类法建立在学科分类体系之上,强调类表的科学性和专业性,以数字、字母和符号为标记,不像自然语言那样通俗易懂。它的特点是:科学,确切。科学,即采用通行的科学名词做类目名称,而不是采用旧称、俗称、不能准确表达全称原意的简称、不通行的译名、同义词、近义词等做类目名称。确切,即所用的词能准确、恰当地反映类目的实际内容范围,既不使用概念外延大于类目实际范围的词或词组做类目名称,也不使用概念外延小于类目实际范围的词或词组作类目名称。对于大部分网络用户来说,习惯采用所熟悉的流行用语、俗称、简称。他们对传统文献分类法不熟悉,也难以掌握。
传统文献分类法类目间的顺序很稳定,难以调整和增加新类目,因而不能及时地反映新学科和新知识。而网络用户知识结构存在差异,信息素养水平不一,要求网络信息分类法具有较强的包容性、通用性和易用性。
不仅如此,网络信息资源数量广泛,内容丰富。以搜索引擎为代表的信息检索工具数量大,类型多,这就为用户的选择提供了较大的余地。而随着互联网逐步向各层次的居民扩散。已经日益社会化的图书馆和情报检索机构吸引网络用户的动力和压力也日增。
实际上,我国图书情报界已经认识到网络用户所带来的动力和压力。在中国图书馆分类法编委会网站首页上,除了常见问题以外,在醒目位置还设置了以下栏目:《中国图书馆分类法》相关问题咨询、《中国分类主题词表》相关问题咨询、分类及主题标引疑难问题咨询。这三个栏目回答了共计8页112个常见问题。其中,关于分类、主题标引的问题占主要部分,可见,编委会已经在帮助网络用户更好地理解文献分类,更多地满足用户应用的需要。
2 分众分类法的探索
用户无法通过中图法查准查全文献,暴露了这种分类法与实际应用之间的矛盾。于是有学者介绍了网络上流行的公众分类法,作为完善中图法的一种探索。
公众分类法也称为社会化分类法、社会化标引、社会化标签或协作式标签等,在维基百科中的定义为:一种通过协作式创建和管理标签对内容进行注解和分类的方法和实践。与传统的主题索引相比,元数据不仅由专家产生也可以由作者和内容的消费者即用户提供。通常,使用自由选择关键词来代替受控词表。[④]
这种分类法的操作方式就是:用户为收藏的网页、上传的图片等数字资源添加一个或多个书签(Tag),网站通过统计这些标签从而自行对信息内容分类、管理。
公众分类法最根本的特点就是用户中心,强调用户参与分类法的创建和维护过程。它的基础不是专家的知识和智慧,而是根据用户对网络资源主题的理解和描述来创建的主题词。用户可以自由选择词来标注资源,也可以使用网站基于统计结果向用户提供的某些使用频率高的标签。词汇来源于日常自然语言而不是采用预先设定好的分类规则和词表。这种分类法能够迅速适应大众词汇动态变化,及时吸纳新词入类,并能反映用户的观点。
以中图法为代表的传统分类法与分众分类法的区别在于分类法是一种制定者中心的语言,由专业人员编撰和控制,使用规范语言,预先建立体系结构。公众分类法是一种用户中心的语言,无需预先编制、维护和学习庞大的分类体系表,也无需掌握专门的图书馆领域专业技术方法和专业培训,能够节省用户的时间和精力。
但是,公众分类法的缺点与优点一样明显:由于不同用户之间客观存在的差异性,导致信息标注时易受个人理解力、知识结构、偏好等因素影响,存在着书签欠精确、被滥用等诸多问题。用户标注的信息为平列式,因此很难揭示信息之间复杂的关系。另外,受大众浅层信息需求的误导,很多有价值的信息也容易被淹没。更一步地分析,可以发现分众分类法体系不严密,知识领域不全;类目设置缺乏规律;类名不规范;类目划分逻辑混乱。
这是网络分众分类法的问题,然而分众分类法来源于用户书签,这些问题恰恰反映了用户对于文献信息的理解是体系不严密的,知识领域不全面的,缺乏规律的,不规范而逻辑混乱的。大部分用户的信息素养不可能一夕培养,改进中图法的指导思想是以用户为中心。
3 建议以用户为中心完善中图分类法
信息技术的出现为传统分类法在新时代的应用和完善提供了丰富的途径,网络自动聚类、知识挖掘辅助工具、动态维护、实时修订等使得中图分类法不仅保持了对文献内容揭示上的深度和广度,而且还适应了从文献组织到知识组织的转变。然而,下一步转变必须回答的问题是:分类法到底是为制定者、实施者服务,还是为最终用户服务。中图法的应用必须从为图书分类排架、书目组织服务,从为管理员服务向转向为最终用户服务上。
现在大部分用户的要求是:
第一,横向性要求。传统的文献分类法以学科聚类,类目的等级结构是文献分类法的重要特征。而现实中的广泛用户习惯的是领域、行业等横向的知识面。所以,必须把领域、行业也作为分类的基础。
第二,深入性要求。横向上,相比学科的划分,用户更加习惯行业、专业的区分。同时,用户还重视纵向上时间、地点、事件、团体、人物的标注,以及这些信息内在的各种关联关系。要求利用信息抽取技术把非结构化信息进行结构化,并与原有的结构化信息进行整合,便于对其进行归并、统计、挖掘。
第三,用户对文献有特定需求,例如,查找某种类型文献或者某种格式文献。
第四,准确性要求。
第五,及时性要求,用户对文献时效性要求增强,从而对分类法的实时更新提出更高要求。
根据用户的这些要求,可以尝试对中图分类法做以下的改进:
首先,调整类目。
类目是分类法的基本单元。类目的完善是分类法完善的捷径。调整的方面包括:一是,在类目的划分上,采用多维标准进行划分,更加准确地反映现实事物的复杂性,也能够为用户提供多角度、多途径的检索入口。二是,减少类目层次。类目层次要求设计合理,宜少不宜多,突出重点。这个改动主要是考虑到网络环境下,基本大类设置除了要考虑知识的系统性、科学性外,还要考虑信息资源本身的价值重要性及用户的兴趣,以及如何使得类目体系更加简单明了,方便终端用户的理解与掌握。因此可将一些重要的、用户关注较多的次一级类目提升到高一级。三是,根据类目下资源增删类目。现行分类法中资源分布不均衡,有的类目汇集大量的资源,而有的类目却没有资源或资源很少。因此,可以通过为特定类目添加子类目体系拓展现有的分类法。也可以将某些类目合并入高一级缩减现有的分类法。四是,加强类目说明,改进传统文献分类法某些类名过分概括造成的不足。说明能够使用户了解类目的覆盖范围和内容含义。目前可用最适宜的方法是列举主题,通过简炼的术语明确类目范围,说明类目的内容含义,展示类目关系。
其次,选择词汇。在词汇的选择上,应尽量使用通俗易懂的语词,使大多数的用户易于理解,尤其是对于一些非学术性信息,应适当地使用自然语言。
再次,技术改进。
自2008年起,国家图书馆开始研发《中分表》修订维护系统及网络版,包括《中图法》网络版,将支持基于XML和MARC的机读格式,通过网络访问实现分类号与主题词的互操作检索和浏览,并通过用户订制,方便快速实现多个OPAC的文献主题一体化检索,实现基于知识组织的文献网络检索服务。[⑤]目前,《中图法》已经从印刷型工具发展成电子工具,未来电子版能够满足知识组织系统网络共享和交互发展的需求、网络服务的需求和实时修订的需求。[⑥]
注释