我国索引研究二十年回顾与展望
——纪念中国索引学会成立20周年(上)
邱均平 楼 雯
(武汉大学中国科学评价研究中心 430072)
摘 要 中国索引学会成立20年来,为索引事业的发展做出了巨大贡献。20年来,我国索引事业发展如何?索引学正走向哪一发展阶段?有何发展趋势?这些都值得我们去深入分析和研究。本文利用文献计量法、内容分析法和社会网络分析法,对来源于CNKI的20年的(1991-2010年)索引学研究论文的总体、主题、关键词以及作者进行分析,发现索引学文献的增长符合逻辑增长规律;索引学期刊整体上符合布拉德福的文献集中与离散定律;索引学论文作者较符合洛特卡定律;说明索引学正趋于稳定发展的时期,研究重点主要在索引的理论、编制以及索引的广泛应用上;索引研究将更注重索引的实用性与其技术的发展。
关键词 索引学 中国索引学会 文献计量法 共词分析 作者分析
Abstract: The China Society of Indexers was found 20 years ago, its members have made a great contribition to the development of index study. 20 years passed, how index study develops, which period it has been through, those are what we should look into. The paper uses bibliometric, content analysis method and social network analysis to analyze overall, subjects, keywords and authors of journal articles of index study which are collected from CNKI from 1991 to 2010. And it shows that the growth model of the papers likely matches the logistic growth model, and the journal distribution is in accordance with Bradfords’ Law in general, moreover, the authors’ distribution is nearly in line with Lotka’s law. These all indicate that the index study is stabilizing development period, its research focuses primarily on the theory and the establishment of the index and its wide range of applications. In the future the China Society of Indexers will pay more attention to the usefulness of the index and its technology.
Keywords: Index Study,CSI,Bibliometric,Co-word Analysis,Author Analysis
1 引言
索引是对某种或某一文献集合中所包含的各篇文章,或所讨论的各个局部主题,或所涉及的各种事项(如地区、人物等)以简明的方式分别著录标引,为用户提供便捷检索服务的工具[1]。我国近代索引的出现大约有不到一百年的历史,在学者研究时习惯把它当作一种方法,即“索引法”。而“索引学”这一学科的确立,主要源于1991年中国索引学会的成立,开展索引服务,是学会走向社会,融入信息服务业,促进我国索引事业前进的主要道路[2]。学会创建以来,至今已经走过了20个春秋冬夏,本文对20年来我国索引学研究历程及发展趋势进行较为系统的分析,回顾学会成立以来我国索引事业的发展情况,以期为后续研究与实践的开展提供参考,也以示纪念。
现如今,有很多种方法可以用来揭示一个学科的发展和趋势,如论文综述、专家访谈、知识图谱等,其中通过学术期刊论文的统计分析是一种定量的可靠的途径[3]。公开的学术期刊论文拥有出版周期短、种类多的特点,对期刊的一些款目进行统计分析,能够较及时客观全面地反映各个领域的成果和水平,在此过程中主要用到文献计量法、内容分析法和社会网络分析法等研究方法。
2 数据来源与处理
定量分析方法需要大量的数据支持,可靠和准确的数据来源和处理是研究可信的保证。
2.1 数据来源
我们选取CNKI的学术期刊网络出版总库作为数据的来源,其收录范围广而全符合我们研究的要求。在检索式的选择上,首先,我们查阅了《中国分类主题词表》中与“索引”有关的主题词,将其归纳整理后,发现与“索引”有关的叙词都含“索引”两字(如索引文法、索引组织等),因此我们可以确定直接用“索引”一词作为主题词或关键词进行搜索,并不影响检索效果[4]。据此,1991年至2010年的索引学研究论文在期刊库中共检索到28805篇。
2.2 数据处理
我们对28805篇文献进行处理,滤掉会议通知、会议报导、征稿简则、年度索引等非正式论文,在这里要说明的是,尽管本文是研究索引学的发展与趋势,但年度索引或工具书等索引形式的文献是应用索引法编制成的文献,并不是对索引学进行研究的论文,不符合我们研究的目的,因此也一并滤掉,最终得到索引学研究论文共11498篇。整个过程中,我们用计算机编制的程序实现自动化处理,但不排除遗漏或重复文献的情况,因此结合人工筛选,尽可能减小原始数据不准确带来的误差。
3 索引学论文年代分布
众多研究证明,文献信息数量随时间变化的关系,可以大致揭示科学发展的某些特点和规律,因此衡量一门科学发展的重要参数指标就是科学专业论文数量的变化,而用情报研究中常用的绘制拟合曲线,对评价该学科所处的阶段,预测该领域的发展趋势和动态具有重要意义。
3.1 索引学研究论文数量
20年间共有索引学论文11498篇,从1991年的276篇发展到2010年的1038篇,但期间并不是完全均匀增长,分别在1993年和2006年前后有所波动(见图1)。表1是所有索引学研究论文以一年为段进行的统计及占期刊库所有学科各年段论文问题的比例,可以看出索引学论文在所有论文中所占比例比较稳定,基本保持在0.45‰左右,只有1996年到2000年的期刊所占比例未达到0.4‰以上,这是由于期刊库本身在20世纪90年代初收录的总期刊不全,还有是因为我们用人工筛选文献时,只能做到一定程度上的统一准确。总体来说,索引学研究论文在期刊库中所占比例很低,不如其他人文社会科学类的学科论文所占期刊库论文的比例(如情报学的所占比例在2‰到3‰之间)[5],可以说明索引学还有很大的发展空间,也需要众多索引学学者在该领域进行探究。
图1 索引学各年论文量
表1 索引学研究论文所占比例
年段 | 1991-1995 | 1996-2000 | 2001-2005 | 2006-2010 |
论文总数 | 3055307 | 5340687 | 7761227 | 11294363 |
论文数 | 1296 | 1895 | 3455 | 4852 |
所占比例(‰) | 0.424 | 0.355 | 0.445 | 0.43 |
3.2 索引学研究论文增长模式
文献信息的增长规律是“三计学”的六大规律之一,普赖斯指数增长模型、线性增长模型和逻辑增长模型都是已经成为经典的分析文献增长的模型,我们可以用这些模型,对索引学的文献增长进行数学模型的拟合分析。
情报学家普赖斯在《小科学,大科学》一书中论述了科学文献和科研人员的指数增长定律和逻辑增长定律,并指出指数型规律终将成为逻辑型,因此,科学文献的增长呈现阶段性[6]。
图2 索引学论文增长拟合
我们将20年来索引学的逐年论文量计算其逐年累积文献量,年度编号用X表示,逐年累积文献量用Y表示,对两组数据用SPSS17.0作回归分析,进行拟合判断。发现索引学研究论文逐年累积文献量符合逻辑曲线分布,可用方程Y=1/(1/3000+0.852×0.003X)表示,数据显示拟合显著性较高,R2为0.960,P≈0.000,所以方程具有很好的拟合度(见图2)。可以看出,我国索引学的研究事业从1991年一直处于快速发展状态,到了2005年以后开始平稳发展,可以认为索引学目前处于大发展与稳定发展的过渡期。随着中国索引学会提供索引服务,走向社会的发展进程步步迈进,索引学也会逐步完善,正如张琪玉教授的思想:当索引这门学问拥有丰富的科学体系和科学结构时,索引学就是一门成熟的学科了[7]。
索引是基于情报检索语言发展起来的,它有深厚的学科背景,但也因此使它更具传统性和专一性,造成我国索引知识的普及程度较低。在信息社会高速发展的现代,索引以一种新的形式展现在公众眼前,那就是数据库。近些年,一些学者在研究数据库的同时,还结合了传统索引的技巧和功能,所以我们相信在今后一段时间内索引学会逐渐适应新兴时代的发展模式,建立索引学的科学体系和结构,成为待续稳定发展的学科。
4 索引学论文期刊分布分析
布拉德福最早发现了文献信息的集中与离散的分布规律(布氏定律),他指出某一特定课题、学科或领域的论文在期刊中不是均匀分布的,而是具有明显的集中与离散规律。那么索引学研究论文是否也符合这一定律?能够代表索引学研究核心的期刊都有哪些?
4.1 各年段期刊数量统计
根据我们的统计,20年来有3193种期刊载有索引学论文,期刊数量比较多,一定程度上说明索引学涉及的领域比较广。至今,我国期刊数量已近1万家[8],CNKI收录了其中的9466种期刊,就是说有三分之一的国内期刊收录了有关索引学方面的论文,还有不少学术期刊是内部刊物或停刊、改动刊名等情况,我们都没有算在内,实际比例应该更高一些。表2中列出各年段载有索引学论文的期刊种数,载文比表示在各时段平均每种期刊载文数量,可以看出,索引学论文分布较为均匀,并呈逐年段上升的趋势,每个阶段的载文比都在2篇到3篇,即一个阶段平均每一种期刊的论文都会有2篇到3篇的文章是有关索引的。综合以上两个特点,即期刊种类较多,载文比较小,说明索引学研究论文分布领域较广,其中1991-1995年分布最广,而2006-2010年相对集中,这种过程的演变,也是学科不断发展的表征。
表2 各年段索引学期刊数量
| 1991-1995 | 1996-2000 | 2001-2005 | 2006-2010 |
论文篇数 | 1296 | 1895 | 3455 | 4852 |
期刊数 | 526 | 652 | 1256 | 1493 |
载文比 | 2.46 | 2.91 | 2.75 | 3.25 |
4.2 各年段高频期刊分布
在我们统计的3135种期刊中,有一部分期刊发表相关论文数量较多,我们称其为高频期刊,它们在很大程度上代表一门学科在某时间段的研究重点,表3是各年段载有索引学论文最高的前15种期刊。
从中可以看出,图书情报类的期刊在20年的时间内逐年段减少,1991-1995年这段时间中,15种高频期刊中就有11种是图书情报类的期刊,而2006-2010年时只剩排名靠后的《图书情报工作》,说明图书情报学的研究人员逐渐淡出索引学;另一个特点是第一年段图书情报类的期刊主要为图书馆学的期刊,第二年段涌现出一批情报学类的期刊,到第三年段发现图书馆学的期刊已经全部被情报学的期刊替代,这一特点说明索引作为最初为图书馆编目标引服务的工具,逐渐转变成为学者对其体系和内容进行研究的学科。
另一方面,相对于图书情报类期刊逐渐减少,计算机类期刊则逐年段增多,高频期刊中从第一阶段没有一种计算机类的期刊,至2006-2010年段的12种都是计算机类的期刊,尤其是从在2001-2005年突然占据高频期刊种数的一半,这种爆发式的剧增与索引事业积极融入新时代的行动是密不可分的。后经证实,这些期刊能出现在有关索引学的高频期刊中,是因为它们大多专注于索引自动化、数据库技术和搜索引擎优化等的研究,索引学学者对索引在新世纪的创新做出杰出贡献。
表3 各年段高频期刊分布
1991-1995 | 1996-2000 | 2001-2005 | 2006-2010 |
刊名 | 频次 | 刊名 | 频次 | 刊名 | 频次 | 刊名 | 频次 |
辞书研究 | 35 | 中国科技期刊研究 | 49 | 计算机工程与应用 | 106 | 计算机工程 | 204 |
图书馆杂志 | 32 | 医学情报工作 | 36 | 计算机科学 | 65 | 计算机工程与应用 | 117 |
医学图书馆通讯 | 30 | 辞书研究 | 33 | 计算机工程 | 59 | 计算机应用 | 88 |
医学情报工作 | 27 | 图书馆杂志 | 29 | 西北工业大学学报 | 43 | 计算机应用研究 | 74 |
图书馆论坛 | 24 | 江苏图书馆学报 | 27 | 现代情报 | 38 | 计算机工程与设计 | 69 |
图书馆建设 | 23 | 情报杂志 | 27 | 现代图书情报技术 | 37 | 电脑知识与技术 | 64 |
图书馆学研究 | 20 | 图书馆建设 | 24 | 小型微型计算机系统 | 36 | 微计算机信息 | 63 |
中国科技期刊研究 | 20 | 医学图书馆通讯 | 23 | 计算机应用 | 35 | 计算机科学 | 62 |
大学图书馆学报 | 19 | 计算机工程与应用 | 20 | 计算机应用研究 | 33 | 西北工业大学学报 | 59 |
情报理论与实践 | 17 | 年鉴信息与研究 | 20 | 情报科学 | 33 | 小型微型计算机系统 | 58 |
数量经济技术经济研究 | 17 | 情报科学 | 20 | 情报杂志 | 33 | 计算机应用与软件 | 55 |
江苏图书馆学报 | 16 | 图书情报工作 | 19 | 计算机研究与发展 | 31 | 计算机研究与发展 | 50 |
农业图书情报学刊 | 16 | 现代图书情报技术 | 19 | 软件学报 | 28 | 测绘科学 | 42 |
图书馆理论与实践 | 15 | 计算机应用研究 | 18 | 情报学报 | 24 | 图书情报工作 | 39 |
文献 | 15 | 图书馆理论与实践 | 18 | 中国科技期刊研究 | 24 | 软件学报 | 37 |
表4为所有年份高频期刊分布,排出了20年间发表论文数不少于34的55种期刊,共载有论文3947篇,即不足全部期刊总数的2%的期刊就发表了全部论文数的34%的论文,说明索引学有关论文相当集中。同时,从表3、表4综合看出,除图书情报学和计算机类的期刊,一些期刊与索引学有密切关系,比如《辞书研究》、《中国科技期刊研究》等,还有索引学边缘学科的期刊(《测绘科学》、多个学报)也在不断涌现,说明索引学保持其自身的传统特色的同时,还扩展了研究和应用的领域,做到传统与创新的兼收并蓄。
表4 20年中索引学高频期刊分布(频次≥34)
刊名 | 频次 | 刊名 | 频次 | 刊名 | 频次 | 刊名 | 频次 |
计算机工程 | 284 | 情报科学 | 89 | 农业图书情报学刊 | 53 | 图书与情报 | 40 |
计算机工程与应用 | 244 | 计算机工程与设计 | 87 | 医学图书馆通讯 | 53 | 计算机辅助设计与图形学学报 | 38 |
计算机科学 | 134 | 电脑知识与技术 | 81 | 计算机工程与科学 | 52 | 科技情报开发与经济 | 38 |
计算机应用 | 129 | 现代情报 | 79 | 大学图书馆学报 | 51 | 解放军外国语学院学报 | 37 |
计算机应用研究 | 128 | 计算机应用与软件 | 76 | 电脑编程技巧与维护 | 51 | 科技信息 | 37 |
西北工业大学学报 | 112 | 软件学报 | 75 | 中国图象图形学报 | 51 | 编辑学报 | 36 |
中国科技期刊研究 | 111 | 情报学报 | 72 | 图书馆学研究 | 48 | 微电子学与计算机 | 36 |
小型微型计算机系统 | 104 | 微计算机信息 | 70 | 测绘科学 | 46 | 大学图书情报学刊 | 35 |
现代图书情报技术 | 101 | 医学情报工作 | 69 | 情报理论与实践 | 46 | 计算机与数字工程 | 35 |
辞书研究 | 96 | 图书馆建设 | 68 | 江苏图书馆学报 | 45 | 西南民族大学学报 (人文社科版) | 35 |
情报杂志 | 96 | 计算机学报 | 62 | 福建电脑 | 43 | 中国图书馆学报 | 35 |
图书馆杂志 | 94 | 图书馆理论与实践 | 59 | 华中科技大学学报 (自然科学版) | 41 | 计算机与现代化 | 34 |
图书情报工作 | 93 | 计算机系统应用 | 57 | 年鉴信息与研究 | 41 | 情报资料工作 | 34 |
计算机研究与发展 | 91 | 图书馆论坛 | 54 | 文献 | 41 | | |
4.3 各年段期刊分布规律
下面我们按照布氏定律方法分析索引学研究论文发表的期刊。表5所示的是全部索引学期刊的布拉德福分区表,分析所有年度期刊上的相关论文,按照平均载文量的多少排序,可将发表索引学领域论文的相关期刊分成相等三个区:35篇以上的期刊;小于等于34篇而大于等于5篇的期刊;小于等于4篇的期刊。可以看出,期刊的各区相关论文数大体相等,而相继各区的期刊数基本上成等比数列N1:N2:N3=53:379:2703≈1:7:72,公比约等于7,说明索引学论文较好地符合了布拉德福定律。
表6是按年段进行计算的期刊论文聚集情况,尽管每年段的公比不尽相同(在4-7之间),但明显看出,后三年段较好地符合了布氏定律,第一年段存在较大偏差,其原因主要是布氏定律只有充分满足几个条件才能成立,其应用也受这些因素影响,索引学在中国索引学会成立后的发展还处在学科的探索时期,受其他环境的影响也较多,所以论文数没有严格遵循布氏的三分法。
表5 索引学期刊整体分区表
分区号 | 载文数 | 期刊数 | 论文数 |
1 | ≥35 | 53 | 3879 |
2 | 5-34 | 379 | 3817 |
3 | ≤4 | 2703 | 3802 |
表6 索引学期刊各年段分区表
| 1991-1995 | 1996-2000 | 2001-2005 | 2006-2010 |
分区号 | 载文数 | 期刊数 | 论文数 | 载文数 | 期刊数 | 论文数 | 载文数 | 期刊数 | 论文数 | 载文数 | 期刊数 | 论文数 |
1 | ≥13 | 19 | 378 | ≥10 | 34 | 621 | ≥10 | 48 | 1122 | ≥23 | 33 | 1614 |
2 | 3-12 | 113 | 403 | 3-9 | 141 | 654 | 3-9 | 207 | 1201 | 4-22 | 213 | 1620 |
3 | ≤2 | 394 | 515 | ≤2 | 477 | 620 | ≤2 | 1001 | 1132 | ≤3 | 1247 | 1618 |
总体来说,虽然索引学期刊较好地符合了布氏定律,但我们可以看到,一区的期刊数几乎都在30种以上,而社会科学的核心期刊一般控制在20种左右[9],这样很不利于核心期刊的选取,说明了索引学文献一方面拥有其聚集状态,另一方面却将一部分重要文献分布在过于广泛的核心期刊中,学科研究不够集中,这一点应引起相关学者的注意。
5 索引学论文主题分析
5.1 论文内容分析
应用内容分析方法,对文献的特定主题内容进行定性和定量剖析,可以提示该主题内容的实质,系统、客观地把握其研究动态和趋势[10]。
5.1.1 索引学主题的类目与分析单元
侯汉清教授曾指出索引学的主要研究领域包括索引语言、索引系统、索引技术、各学科文献的主题标引、各类型索引的编制、索引生产、数据库及联机检索等[11]。《中分表》收录的所有有关索引的叙词有“索引编制”、“索引编制自动化”、“索引编制机械化”、“索引理论”、“索引方法”、“索引文法”、“索引文件”、“索引组织”,加之近年来索引学的发展,我们综合得出索引学主题应分为索引理论,索引的编制,索引的应用,索引事业,索引的相关学科这五大类,细分的类目与分析单元见表7。
表7 类目与分析单元表
索引理论 | 索引编制 | 索引的应用 | 索引事业 | 相关学科 | 其他 |
历史 | 结构 | 用于检索 | 培训 | 目录学 | |
索引语言 | 技术 | 数据库与联机检索 | 组织活动 | 文献学 | |
索引系统 | 标准 | 信息服务 | | 图书情报学 | |
| | 知识管理 | | | |
| | 资源开发与利用 | | | |
| | 用于评价 | | | |
索引理论由历史、索引语言和索引系统三个类目组成,其中,“历史”包括索引的发展或变化,索引学研究综述,索引学者传记等方面,“索引语言”包括情报检索语言,索引的编码语言等方面,“索引系统”包括关键词索引、保留上下文索引等传统的索引系统;也包括现代数据信息处理系统,如二次文献生成系统、管理信息系统等;还包括数字化的索引,如工程索引的CD光盘版,科学引文索引的扩展版等。
索引的编制是一项技术劳动,索引编制的好坏直接决定了索引的功用,从索引的编制步骤来看,索引编制可以分为选题、制定计划、编制类目表、分析文献、著录与编排、编辑加工等,但从索引的定义来看,即“索引是根据人们的一定需要,将有关文献的某类信息如篇目、语词、句子、人名、地名、书名、主题、事项及其他事物名称等分别摘录出来,注明出处,并按照一定的规律和排序方法组织编排起来供人们查检的一种检索工具”,其中的某类信息指的就是索引项,是索引结构的一部分,“一定的规律”指的是索引编制的标准和规则,而整个编制的过程则是索引的编制技术。因此,我们将索引编制分为结构、标准和技术三个部分。
索引属于二次文献,具有检索功能,起着指南和工具的作用,曾经索引主要用于检索,但信息时代同样赋予索引更多更丰富的功用。张琪玉教授曾说过21世纪的索引就是数据库,所以我们把数据库与联机检索单独提出作为索引的一项巨大的应用;同时索引作为二次文献,担当着二次文献最基本的提供信息服务的义务,提供的信息服务有图书馆咨询服务,科技情报服务等;索引也可以应用于知识管理,如档案管理、期刊管理、企业或个人知识管理等等,都可以借助索引对信息和知识实行有效有序整理;索引还是资源开发与利用的有利工作,如信息资源的开发编纂,期刊、档案的利用等;索引还可以应用于核心期刊的遴选、学科发展的评介、工作人员的绩效评估等。
另外,组织索引员的培训和索引活动是索引工作和索引学发展成熟的体现,设立这一类目就是为了考察索引学会成立20周年来,索引工作是否更专业化更职业化。
我们读取11498篇论文的题录信息,按照上述分类将它们分到各个类目下,得到每个类目所属的所有论文数,见表8至表12。而图3表示六个分析类目在不同年段的论文变化情况,可以很清晰的看出,索引理论、索引编制和索引的应用在四个年段都占绝大部分比重,其中索引的应用所占比重最高,这正是因为索引是为用户提供服务的工具,其实用性和易用性都是作为工具的必要条件,索引的多种应用是学者研究的重点所在。其次,索引编制的论文比例一直在上升,说明学者越来越重视索引的结构、技术与标准的研究,特别是索引的编制技术,直接关系到索引实用功能的好坏。另外,索引的理论研究大体上看呈下降趋势,一方面是因为索引编制的研究论文逐年段上升,另一方面,索引本身是应用性很强的工具,理论研究便稍显薄弱。但理论用于指导实践,相关学者加强对理论体系的研究,能够对索引学的整体发展有更大帮助。最后值得注意的是相关学科的研究也呈逐年段下降的态势,表明索引学研究更专业更具独立性的同时,也与相关学科的关联逐渐减少。
图3 各类目分年段论文分布情况
5.1.2 研究索引理论的论文特点与变化
由表8可以看出,索引系统的研究是索引理论研究的重点,其总体论文量已超过半数,逐年段上升的同时在2006-2010年达到最高点,这是因为索引作为工具,最后呈现在用户面前的是系统的形式,不管是传统的主题索引、文摘索引,还是引文索引的电子版,学者只有更多地关注索引系统的研究,才能将索引做得更好。与索引系统所占比例相反的情况是索引历史的逐年段下降,从一个学科理论的发展来讲,这不失为一种好现象,说明我国学者将更多的注意力与关注点放在真正的理论体系建设上,不再一味回顾历史或写评论。但学科历史的研究并不是不重要,从表8中看到对历史的研究同时占到约三分之一的比重,因为适时综述学科研究,撰写学科带头人对学科的贡献等,可以衡量学科目前发展现状,对未来研究具有指导意义。另外,索引语言一直在13%的比例上下浮动,所占比重较其他两个分析单元稍低,这是因为索引语言主要由情报学的情报检索语言和计算机学科的计算机语言组成,这两种语言到20世纪90年代时已经发展了将近半个世纪,可以说发展较为成熟,尤其计算机语言更是变化很小。表中第一次的浮动是因为90年代后期我国兴起了大规模的研究分类主题语言一体化的热潮,众多成果呈现于科学界,而第四年段时到达顶点是因为21世纪初本体和大众分类法等新兴技术浮出水面,这势必带来分类法和情报检索语言的变革,从而影响到索引语言。
表8 索引理论论文各年段频次变化
| 1991-1995 | 1996-2000 | 2001-2005 | 2006-2010 | 总体 |
历史 | 100(38.31) | 150(35.54) | 198(34.55) | 218(28.5) | 666(32.95) |
索引语言 | 34(13.02) | 58(13.74) | 71(12.39) | 108(14.11) | 271(13.4) |
索引系统 | 127(48.65) | 214(50.71) | 304(53.05) | 439(57.39) | 1084(53.64) |
注:()中数字为该类目占本年段论文总数的百分比,下同。
5.1.3 研究索引编制的论文特点与变化
索引结构包括款目、参照系统和字顺排列三部分,它们直接影响用户使用时的易用性和美观性,所以体现在研究论文上,结构一直占四分之一的比重,说明其受到一定的重视。上文已经阐述过索引编制对索引的重要性,而索引的编制技术对于索引的编制也是同等重要的,正如表9反映出的结果,技术这一分析单元在整个类目中所占比重最大,是索引编制过程中最重要的部分。这里,我们所指的索引技术是在索引的编制过程中应用的方法或技术,比如索引项和款目是怎样选定与排序的,以及计算机是怎样帮助编制索引的。表9中研究技术的论文比例连年攀升,这是因为索引学的发展与扩大,索引技术的研究从最初研究主题分析、款目的转换、自然与人工语言的选择的层面,拓宽到更广阔的空间,现在的索引技术是组织大型数据库的一种重要技术,帮助数据库组织和存储大量记录,实现高效检索。与技术研究的火热势头相反的是标准研究的直线下降,这首先是因为标准的特殊性,尽管标准与法律一样,都会随着时代的发展进行改版,但标准却是经过众多业界专家精心制订,慎重颁布实施的;其次是因为索引学研究重心的转移,机械化自动化的编制和数据库研究带来的挑战,也使得标准的建立更加困难。但值得庆幸的是,经过20多年的努力与酝酿,2008年中国索引学会主持制订的国家标准《索引编制规则(总则)》,正式颁布并实施。这是中国索引事业的一件大事,标志着中国索引编制工作进入一个崭新的发展阶段。
表9 索引编制论文各年段频次变化
| 1991-1995 | 1996-2000 | 2001-2005 | 2006-2010 | 总体 |
结构 | 53(23.45) | 93(23.25) | 212(24.36) | 323(22.41) | 681(23.18) |
技术 | 147(65.04) | 275(68.75) | 601(69.08) | 1098(76.19) | 2121(72.21) |
标准 | 26(11.5) | 32(8) | 57(6.55) | 20(1.38) | 135(4.59) |
5.1.4 研究索引的应用的论文特点与变化
观察表10,我们可以发现六类索引应用研究的论文可以从其年段变化上分成两类。即除了应用于检索的论文和研究数据库与联机检索的论文呈增长态势外,其他分析单元都趋向递减,尤其是应用在评价上的文章下滑幅度最大。人们发现评价图书或期刊的质量可以把是否配有索引作为指标之一,或者遴选文章进入年度优秀论文索引时,索引被用于评价期刊和其他文献类型的功能便显现出来,尤其是美国的科学引文索引引入我国后,用影响因子和其他JCR、ESI中的指标作为评价依据的研究越来越多,体现在表中评价在第二年段的增长情况,但近年来作为便于科学研究出发点良好的SCI,在我国的发展却变了味,连加菲尔德本身都说“用期刊的影响来评价单篇的论文或某个作者存在固有的缺陷很危险”[12],类似的质疑引起了索引应用在评价上的研究,于是出现表中第三和第四年段的大幅下降。其次,索引用于检索是其素有的特点,新世纪的索引就是数据库的理论也深入人心,所以在表10中用于检索和数据库的研究是比重最大、论文数量最多的,其呈上升趋势,说明索引研究的重点在且将在这两方面上。另外,索引在信息服务、知识管理和资源开发与利用的应用虽呈下降趋势,但较平稳,且论文数量也较多,说明在这三方面逐年得到部分学者的青睐,但受到的重视还不够,索引事业要发展得更长久更宽广,那么索引研究就应该扩大研究领域和拓宽研究视角,面向21世纪的新兴技术和产业。
表10 索引的应用论文各年段频次变化
| 1991-1995 | 1996-2000 | 2001-2005 | 2006-2010 | 总体 |
用于检索 | 255(35.66) | 298(31.04) | 693(37.28) | 941(38.11) | 2187(36.43) |
数据库与联机检索 | 142(19.86) | 214(22.29) | 467(25.12) | 617(24.99) | 1440(23.99) |
信息服务 | 70(9.79) | 81(8.43) | 162(8.71) | 196(7.94) | 509(8.48) |
知识管理 | 72(10.06) | 102(10.62) | 175(9.41) | 235(9.52) | 584(9.73) |
资源开发与利用 | 101(14.12) | 131(13.65) | 240(12.91) | 343(13.89) | 815(13.58) |
用于评价 | 75(10.48) | 134(13.95) | 122(6.56) | 137(5.55) | 468(7.8) |
5.1.5 研究索引事业和相关学科的论文特点与变化
为便于观察和篇幅限制等原因,我们将索引事业和相关学科的论文年段变化整合为图4。在图中单独看索引事业,我们可以看到培训和组织活动几乎呈反比例相关,但培训和组织活动并不是对立存在的,索引员的培训是组织活动的重要形式,因此1991年至2010年,两者整体研究的论文趋势是递增的,也是我国索引事业发展的体现。
分析一门学科与其他学科的关联,有助于把握该学科的独立性的同时,也可加强与其他学科的沟通[13]。而索引与相关学科的关联研究,我们仅选择与索引学有源头融合的学科——目录学、文献学以及图书情报学,图中我们看到以图书情报学论文数量最多,这是因为图书情报学近十几年来兼收并蓄,在研究核心内容、学科教育和事业发展上的蓬勃发展[14],使得学者更重视该领域的研究。目录学在20年来还对索引有一定数量的研究,但与文献学的相关研究最后消失了,说明索引学与文献学的关联渐远,逐渐脱离文献学的研究范畴。图4 索引事业和相关学科论文各年段频次变化
综上所述,通过内容分析法我们可以看到索引学目前的研究重点在索引系统、索引编制技术和对其应用于检索和数据库的研究,而对索引历史、索引标准和索引用于评价的研究则越来越少,并且应用方面还需要加强的有信息服务、知识管理和资源开发与利用的研究,另外,索引事业的相关论文的数量很少也是有待加强的方面,最后,索引学目前与图书情报学较目录学和文献学来说更相关,但也有渐渐远离的趋势。
(未完待续)