《中国图书馆分类法》第5版医学类表性能测评
――兼与《杜威十进分类法》第22版医学类表比较
顾 颖
(南京医科大学图书馆 210029)
摘 要 本文统计了《中国图书馆分类法》第5版和《杜威十进分类法》第22版中医学类表中的相关数据,从类目结构、类目数量、类目质量几个方面,利用类号长度、类目包容度、参照度、清晰度等多个性能指标,对两表进行定性定量测评;并根据统计结果提出《中图法》今后借鉴《杜威法》修订医学类表的一些建议。
关键词 《中国图书馆分类法》 《杜威十进分类法》 医学分类表 分类法评价 定量测评
Abstract: To evaluate the performance of Medicine and Health schedule ofChinese Library Classification (5th ed.), the paper compares the schedulestructure, quantities and quality of terms in Medicine and Health Class of CLC5with those of DDC22. And some indicatorssuch as length of class numbers, inclusive degree of terms and so on areproposed to assess the two different medicine and health schedules. Accordingto the statistics and analysis, CLC are suggested to learn from DDC in manyaspects in the future amendment.
Keywords: Chinese Library Classification,Dewey Decimal Classification,Medicine and Health Classification,Classification Evaluation,Quantitative Evaluation
《中国图书馆分类法》(ChineseLibrary Classification,简称CLC)自1975年问世后以其良好的性能和简便实用的使用方法迅速得到推广,目前已成为国内用户最多、影响最广泛的一部大型综合性文献分类法。2010年9月国家图书馆出版社出版了《中国图书馆分类法》第5版。
《杜威十进分类法》(DeweyDecimal Classification,简称DDC)1876年由美国著名图书馆学家杜威(Melvil Dewey)创立,是世界上历史最久且使用最广的分类法,20世纪初被引入中国。《杜威十进分类法》对中国近代及现代图书分类法的理论和实践影响深远,在中国图书分类法的发展史上具有重要地位[1]。
《中国图书馆分类法》和《杜威十进分类法》均属等级列举式分类法,两部类表的体系结构有一定的相似之处;笔者将抽取《中国图书馆分类法》第5版(以下简称CLC5)和《杜威十进分类法》第22版(以下简称DDC22)中的医学类表,比较两表的类目结构,并利用一系列定量指标对两部医学类表进行分析测评,找出它们的特色和不足之处,以期相互借鉴,共同发展。
1 类目体系结构的比较
为了解这两部分类法中医学类表的类目体系和结构,我们首先比较两表的简表类目。简表由分类表的基本类目组成,亦称为基本类目表,通常于基本大类下展开一、二级形成[2]。CLC5和DDC22的医学类目简表详见表1。
表1 医学类目简表比较
CLC5 | DDC22 |
R 医药、卫生 | | 610 医学与卫生 |
R1 预防医学、卫生学 | R74 神经病学与精神病学 | 611 人体解剖学,细胞学,组织学 |
R2 中国医学 | R75 皮肤病学与性病学 | 612 人体生理学 |
R3 基础医学 | R76 耳鼻咽喉科学 | 613 个人卫生与安全 |
R4 临床医学 | R77 眼科学 | 614 法医学;伤害、创伤和疾病的发生; |
R5 内科学 | R78 口腔科学 | 公共预防医学 |
R6 外科学 | R79 外国民族医学 | 615 药理学与治疗学 |
R71妇产科学 | R80 特种医学 | 616 疾病学 |
R72儿科学 | R9 药学 | 617 外科及相关学科 |
R73肿瘤学 |
| 618 妇产科及相关学科 |
CLC5和DDC22的医学类表都遵循了先基础、后临床的列类原则,在西方医学范畴内类目范围也比较接近,反映了现代医学科学的主要内容。但观察表1可以发现,两表的类目结构有着明显的差异。从二级类的数量来看,CLC5医学类表为17个,DDC22医学类表为8个,前者是后者的一倍多。从基本类目的学科分布来看,CLC5的类目划分遵循了现代医学的学科组成,对预防医学、基础医学和临床医学都有系统的反映,体现了较强的科学性;同时分列中国医学和外国民族医学,凸显了民族医学的地位;而DDC22受十进制结构的局限,更受到分类体系框架定格于19世纪的影响,对“预防医学”、“口腔科学”、“眼科学”、“儿科学”等分支学科采取了合并列类的处理方式,同时DDC受早期医学学科发展状况的影响,在立类时主要从实用原则出发,侧重于临床医学,基础医学相关学科除611和612外均未单独列类,而是与临床医学学科混排在一起。此外,DDC对“中国医学”和“外国民族医学”的概念也少有涉及。
为了更清楚的说明两表的差异,现以CLC5中的R5内科学和DDC22中的616疾病学为例进行类目比较,详见表2。
表2 R5内科学与616疾病学类目比较
CLC5 R5 内科学 | DDC22 616疾病学 |
R51 传染病 | 616.001-616.009 标准复分 |
R52 结核病 | 616.02-616.09 疾病总论 |
R53 寄生虫病 | 616.1 心血管系统疾病 |
R535 人畜共患病 | 616.2 呼吸系统疾病 |
R54 心脏、心血管(循环系)疾病 | 616.3 消化系统疾病 |
R55 血液及淋巴系疾病 | 616.4 血液、淋巴系及腺体疾病 内分泌系统疾病 |
R56 呼吸及胸部疾病 | 616.5 皮肤疾病 |
R57 消化系及腹部疾病 | 616.6 泌尿生殖系统疾病 |
R58 内分泌腺疾病及代谢病 | 616.7 肌肉骨骼系统疾病 |
R59 全身性疾病 | 616.8 神经系统疾病及精神紊乱 |
R599 地方病学 | 616.9 其他疾病 |
比较发现,R5和616表在“心血管系统疾病”等多个类目呈现对应关系,但CLC5对DDC22中616.5以后的“皮肤疾病”、“神经系统疾病”、“肿瘤学”等诸多类目进行了单独列类(详见简表),而616表由于列类和结构的限制,不得不利用“616.9其他疾病”实现类目延伸,种种原因使得616表的篇幅占据了整个医学类表的1/3,类目拥挤不堪。以医学发展中的重点学科肿瘤学为例,肿瘤学在CLC5中为二级类目;在DDC22中却只能屈居六级类目616.994,与学科发展态势极不相适。可以看出,DDC22的列类方式虽然压缩了类表篇幅,但学科体系有所欠缺,可能会给文献利用带来不便。DDC的编制者们应当已经意识到这个问题,他们在22版中合并了缺乏文献保障的619实验医学类目,为以后的类目修订做好了铺垫。
2 基于类目数量的评价
类目是文献分类法的基本单元,也是我们衡量和评价一部分类法的基础。表3对CLC3、CLC5和DDC22医学类表中的类目总数进行了统计。可以看出,从CLC3到CLC5,医学类表的类目总数显著增长,满足了用户类分文献的多种需要,也反映了学科专业的发展带来的类目及类目体系的变化[3]。
表3 类目总数和专用复分表的比较
类表名称 | 类目总数 | 专用复分表总数 | 复分类目总数 |
CLC3 医学类表 | 2368[i] | 2 | 14 |
CLC5 医学类表 | 3793 | 4 | 31 |
DDC22医学类表 | 1584 | 3 | 118 |
目前,CLC5医学类表中的类目总数远高于DDC22。进一步抽取两部医学类表中的部分相应类目对比其子目数量(见表4)发现,CLC5医学类表对于诸多类目的划分都比DDC22医学类表中的相应类目更详尽。总体来说,CLC5医学类表篇幅更大,类目展开更充分,词汇完备性和专指度更高,有助于提高文献分类标引和检索的准确性;而DDC22医学类表的类目设置则比较概略,一些比较泛指的检索标识有利用户进行族性检索,提高相关文献的检全率。
表4 部分类目子目数量的比较
CLC5类名 | 子目总数 | DDC22类名 | 子目总数 |
R18 流行病学与防疫 | 66 | 614.4 发病率及公共疾病预防(流行病学入此) | 18 |
R19 卫生事业管理(保健组织与事业) | 54 | 610.6 组织、管理、事业 | 4 |
R32 人体形态学 | 122 | 611 人体解剖学、细胞学、组织学 | 109 |
R33 人体生理学 | 107 | 612 人体生理学 | 201 |
R47 护理学 | 34 | 610.732-610.736 护理 | 7 |
R54 心脏、血管(循环系)疾病 | 78 | 616.1 心血管系统疾病 | 31 |
R6 外科学 | 339 | 617.001-617.5 外科 | 130 |
R711妇科学 | 49 | 618.1 妇科 | 20 |
R73 肿瘤学 | 146 | 616.994 肿瘤学 | 5 |
R97 药学 | 224 | 615 药理学与治疗学 | 157 |
除了主表,在分类法的实际使用过程中,复分表也是至关重要的。复分表是一种压缩篇幅、提高分面组配能力的工具;它可以加强类表的灵活性,使类表在篇幅较小的情况下达到较大的细分程度。CLC5的医学复分表类目设置相对简单,虽有4个专用复分表,但3个复分表集中在R2中国医学,适用范围最广的临床医学复分表也仅包含10个复分类目。而由于主表类目的限制,DDC22则非常注重专用复分表的设置,医学类表在疾病学、外科学和妇产科学分设了3个复分表,表3统计数据显示,DDC22医学类表复分类目总数远高于CLC5。表5选取两表中临床医学类的专用复分表对两表的复分类目情况(类目注释略)进行更深入的比较。
通过表5的比较,我们可以发现,DDC22医学复分表除了医学类目外,实际上还增加了人员复分和总论复分(DDC称为标准复分)的有关类目,此外,心身医学、实验医学、病史等多个主题类目都出现在专用复分表中。说明DDC22较CLC5的医学复分类目设置更详尽,所覆盖的学科范围更广,能够灵活地满足医学文献细分的需要,更适应医学分支学科越来越细的发展趋势。CLC在以后的修订过程中,有必要借鉴DDC的医学复分表对医学复分类目设置进行扩充和调整。
表5 临床专用复分表复分类目比较
R5/8 临床各科 | 616.6-616.9 特定疾病 | | |
01 预防、控制和卫生 | 001哲学理论 | 023 工作人员 | 043 先天疾病 |
02 病理学、病因学 | 002 文集 | 0231 护士 | 0431-0433 微生物学、 |
03 医学微生物学、 | 0028 辅助技术和程序; | 0232 医生 | 特定主题、康复 |
医学免疫学 | 仪器,设备,材料 | 0233 专职医疗人员 | 0435-0439 预防措施、治疗、 |
04 诊断学 | 00284 仪器,设备,材料 | 02332 助理医师 | 病理、心身医学、病史 |
05治疗学 | 003-006 标准复分 | 024 国内医药 | 05 预防措施 |
059.7 急症、急救处理 | 007 教育研究及相关主题 | 025 紧急情况 | 06 治疗 |
06 并发症 | 008 各类人物的历史和描述 | 0252 急救 | 060724 实验研究 |
07 预后 | 0083 青年人 | 027 实验医学 | 061 药物治疗 |
08 诊疗器械、用具 | 0084成年的特定阶段 | 028 重症监护 | 0610724 实验研究 |
09 康复 | 009 历史的、地理的和人员的治疗 | 029 姑息治疗和临终关怀 | 062-069 其他治疗 |
| 0092 人员 | 03 康复 | 07 病理学 |
| 01 医学微生物学 | 04 疾病的特殊分类 | 071 病因学 |
| 014 医学细菌学 | 042 遗传疾病 | 075-079 诊断、预后、死亡、免疫 |
| 015 医学真菌学 | 0421-0423 微生物学、 | 08 心身医学 |
| 016 医学原生动物 | 特定主题、康复 | 09 病史 |
| 019 医学病毒学 | 0423-0429 预防措施、治疗、 |
|
| 02 特定主题 | 病理、心身医学、病史 |
|
3 基于类目质量的评价
3.1 类目包容度
类组是使用合并列类法设立的类目,具体是将若干个相近的并列概念合并设立为一个类目,如中图法中的“TS935刺绣、编结、制毯”[4]。在CLC5和DDC22的医学类表中也有很多这样的类目,如CLC5中的R12环境医学、环境卫生;DDC22中的612.75骨骼、关节、结缔组织等。
我们用类表中类组类目占类目总数的比例来说明类表中类目的包容性,并将其定义为类目包容度。类目包容度越高,表示类表中类目包容的内涵越丰富。计算公式如下:
包容度=类组类目总数/类目总数×100%
利用此公式对CLC5和DDC22医学类表中的类目包容度进行计算比较,见表6。
表6 类组包容度的比较
类表名称 | 类组类目总数 | 类目总数 | 类组包容度 |
CLC5 医学类表 | 201 | 3793 | 5.30% |
DDC22医学类表 | 268 | 1584 | 16.92% |
从上表可以看出,DDC22医学类表在类目总数远小于CLC5的情况下,类组类目总数仍高于CLC5,其类组包容度更是达到CLC5的三倍之多。应该说,这个结果是符合预期的。DDC22医学类表在规模远小于CLC5的情况下,为了实现对学科范围内的文献信息的正确分类标引,必须大幅提高类表中类目的包容性。在一定范围内合并相关类目的做法,可以增加类目内涵,也有助于提高相关文献的检全率。
3.2 类目参照度
类目参照一般用于内容上存在着密切联系,但在分类体系中被分散了的类目;类目参照可以使类目之间的关系揭示得更加充分[5]。
CLC5在类目下统一使用“参见”实现类目参照,如医学类表中:
R576 胰腺疾病
参见 R657.5。
R657.5 胰腺
R599 地方病学
参见 R188。
R188 医学地理学
DDC22使用“see”和“see also”实现类目参照,其中“see”指示如何处理类目主题的部分组成概念或跨学科的概念;“see also”提示由措辞和上下文的细小区别带来的分类区别,提醒分类人员注意那些可能忽视的相关主题。如医学类表中:
611.12 心脏
For 心包, see 611.11
611.11 心包
612.67 老龄化
See also 616.078 for 死亡
616.078 死亡
参照度是指分类法中每个类目接受参照平均数,通常用来评价分类体系揭示类目之间联系强度。类目参照度的计算公式如下:
参照度=参照项总数/类目总数×100%
利用此公式对CLC5和DDC22医学类表中的类目参照度进行计算比较,见表7。
表7 类目参照度的比较
类表名称 | 参照项总数 | 类目总数 | 类目参照度 |
CLC5 医学类表 | 170 | 3793 | 4.48% |
DDC22医学类表 | 381 | 1584 | 20.71% |
从上表可以看出,DDC22医学类表的类目参照度远高于CLC5。这说明DDC22医学类表的类目参照项设置非常详尽,充分揭示了类目间的各种相关关系;而CLC5医学类表的类目参照度则相对较低,这与类表类目划分详尽、类目分散的状况是不相适应的,无法对类目之间的关系进行必要的揭示。参照项太少是CLC5全表的通病,应借鉴DDC的参照项设置予以改进和完善。
3.3 类目注释的清晰度
类目注释是对类目的补充说明文字,一般用小号字加注在类名之下,以说明类目的使用方法、适用范围、类目定义及历史沿革等。类目注释有助于准确、一致、有效地组织和揭示文献信息;类目注释系统的完善和清晰程度,直接关系到分类法的编制质量和使用效果。由于电子版分类法不受类表规模的限制,有些分类法在类目下专门设置了定义项。也有人专门编制、出版了中图法类目词典,为每一类目提供一个定义。
清晰度是指分类法中类目含义的清晰程度,这里假设没有注释的类目含义一般是不够清晰或不清晰的,将清晰度定义为每个类目接受注释项的平均数,以度量类目能被用户所理解并正确使用的可能性。数值愈高,则说明分类表的注释愈清晰、详尽,愈有利于用户理解类目的含义。类目注释清晰度的计算公式如下:
类目清晰度=带注释的类目总数/类目总数×100%(不计专用复分表)
利用此公式对CLC5和DDC22医学类表中的类目注释清晰度进行计算比较,见表8。
表8 注释清晰度的比较
类表名称 | 带注释的类目总数 | 类目总数 | 清晰度 |
CLC5 医学类表 | 1044 | 3793 | 27.52% |
DDC22医学类表 | 1051 | 1584 | 66.35% |
从上表可以看出,DDC22医学类表的类目清晰度很高,近2/3的类目下都有注释,一些类目下还有多条注释,类目注释非常详尽。以615.1药物(药物学)为例,类目下的注释多达5条,对类目定义、范围、沿革、用法都做了详细的注解。
615.1 药物(药物学)
用于诊断、治愈、缓解、治疗、预防疾病的物质 [定义注释]
中成药(前版亦见615.886)、药理学、药剂学入此 [范围注释、历史注释]
药物治疗入615.58 [范围注释]
特定药物及药物组见615.2-615.5;
实验药剂学见615.4;药物的生理作用和治疗作用如615.7 [参见注释]
615.1对615.2-615.3;615.1对615.7见手册 [分类组配注释]
除了以上类型的注释以外,DDC22版医学类表中还有同义词注释、复分仿分注释、优先次序注释等,DDC类目注释类型多样、内容丰富的特点在医学类表中得到了充分的体现。而CLC5医学类表的注释清晰度则相对较低,部分类目缺乏明确具体的注释指引,给文献分类带来困难,如“过度医疗”相关文献,是归入“R197.323.4医疗质量管理”,还是归入“R41临床诊疗问题”或是归入“R417医疗事故与预防”?注释的不确定不但给用户造成困扰,也给标准化著录制造了障碍;提高类目注释的清晰度是CLC在以后的版本修订中应予以重视的问题。
3.4 类号长度
分类号是文献分类法中用于表达类目的代号,也是类目的重要组成部分;简短明了的分类号有助于提高实际工作效率,易读,易写,易于排检。CLC和DDC的配号制度基本遵循层累标记制的原则,不同的是CLC采用的是汉语拼音字母与阿拉伯数字结合的混合号码,如R446.6,而DDC采用的是单纯的阿拉伯数字号码,如610.69。我们通过统计分类号字符的平均长度,对比两部医学类表中标记符号配置的合理性。类号平均长度的计算公式为:
类号平均长度=类号字符总长/类目总数×100%
利用此公式对CLC5和DDC22医学类表中的类号平均长度进行计算比较,见表9。
表9 类号长度的比较
类表名称 | 分类号字符总长 | 正式类目总数 | 类号平均长度 |
CLC5 医学类表 | 25137 | 3793 | 6.63 |
DDC22医学类表 | 11105 | 1584 | 7.01 |
统计结果显示,DDC22医学类表的类号平均长度比CLC5稍长,说明虽然分类号的组成略有不同,但CLC和DDC对标记符号的配置都很重视,即便多次修订过程中不断增强其容纳性,仍然将类号长度保持在一个适中的水平,优越的适用性也是两部类表长久不衰的重要原因。
4 结语
下表将用“+”表示性能好,用“-”表示性能差,对CLC5和DDC22医学类表的类目总数、专用复分表类目数、分类号长度、类目包容度、类目注释清晰度等性能进行比较。
表10 总体比较
类表名称 | 类目总数 | 复分类目总数 | 类号长度 | 参照度 | 包容度 | 清晰度 |
CLC5 医学类表 | + | - | + | - | - | - |
DDC22医学类表 | - | + | - | + | + | + |
通过对中外两部医学类表的类目结构、类目数量和类目质量方面的比较测评,我们发现,CLC5医学类表在类目结构的科学性、主表类目规模和分类号长度等方面胜于DDC22,但在复分的灵活性、类目的参照度、包容度和注释清晰度方面略逊一筹;DDC22医学类表以实用原则为指导划分类目结构,类表篇幅较小;同时充分利用类组类目、专类复分和注释等方式提高分类标引的准确性和方便性,兼容性和灵活性较强。
CLC医学类表在以后的改版和修订过程中应以DDC为鉴,增设专用复分表的复分类目,力求多方位映射主题内容,提高类表的分面组配能力,适应医学学科不断细分的趋势;大量增设类目参照,更加充分地揭示类目间的关系;增设类目注释,使类目含义更清晰,便于用户使用。相信在与DDC相互借鉴、取长补短的过程中,CLC医学类表的功能会更加丰富,使用会更加便捷,从而更广泛、更充分地在医学文献信息的加工和服务工作中发挥其自身价值。
参考文献
1 洪漪. 杜威十进分类法对中国图书分类的影响及启示[J]. 图书馆工作与研究, 1998(1):30-33
2 马张华, 侯汉清, 薛春香.文献分类法主题词法导论(修订版). 国家图书馆出版社, 2009
3 国家图书馆《中国图书馆分类法》编辑委员会.中国图书馆分类法(第五版).北京:国家图书馆出版社,2010
4 张琪玉. 情报语言学词典[M]. 北京: 北京图书馆出版社,2000
5 尚加宁, 韩露盈.图书分类法性能的定量测评初探[J]. 情报理论与实践, 1999, 22(5): 356-358
注释
① 数据来源:侯汉清,王荣授.图书馆分类工作手册.北京:中国科学技术出版社,1992
顾 颖 女,1980年生,硕士,南京医科大学图书馆馆员,发表论文4篇。