索引作为文献计量学分析工具的科学性与局限性
王知津 王 璇 马 婧
(南开大学商学院信息资源管理系 天津300071)
摘 要 索引具有两大基本功能:检索与分析。本文从作者索引、关键词索引、引文索引三种不同类型的索引出发,探讨了它们的文献计量学分析功能,并分别讨论了这三种索引用作文献计量学分析工具的科学性与局限性。最后得出结论,应充分发挥索引的分析功能,以利于科研工作的进行。
关键词 作者索引 关键词索引 引文索引 文献计量学 分析工具
Abstract:Index has two basic functions: retrieval and analysis. In this paper, we begin with three different types of indexes: author index, keyword index, citation index , and discuss their function of bibliometric analysis, and also discuss the scientificalness and limitations of these three indexes as a tool for bibliometric analysis. Finally we conclude that we should give full play to the analysis function of index in order to facilitate the conduct of scientific research.
Keyword: Author Index,Keyword Index,Citation Index,Bibliometrics,Analysis Tools
0 引言
索引被学术界公认为属于二次文献,与书目、文摘一样同属检索工具,起着指南和工具的作用。索引是对某种文献或某一文献集合中所包含的各篇文献,或所讨论的各个局部主题,或所涉及的各种事项(如地区、人物、机构、事件、生物、矿物、产品、设备、公式、数据、著作等)以简明的方式分别著录标引,即确定其检索标识和指出其所在位置,并将款目按一定的可检顺序排列和组织,以方便检索的一种工具[1]。随着信息技术的发展进步,索引工作与计算机技术相结合,标志着现代索引的诞生。传统的索引工作至今已发展成以数据库编制为主的现代索引工作。现代的索引就是数据库,与传统索引相比,现代索引除了具备传统索引所具备的检索功能外,还具有传统索引不具备的功能,例如,出版地、出版年等都可作为检索字段提供检索(一般是作限定检索),还可以实现多种途径的单一检索和多组配检索等。现代索引丰富了检索途径和内容,是一种更为高级的索引,但其本质并未改变。从索引的定义中不难看出,索引最基本的功能是检索,我们称之为第一功能。然而,索引不仅能在检索过程中发挥作用,而且还可以被用作一种对科学活动进行计量、统计和分析的工具。这也是本文将讨论的重点——作为文献计量学分析工具是索引的第二功能。
1 索引作为文献计量学的分析工具
1.1 索引的功能——检索与分析
索引作为一种检索工具,它最基本的功能就是检索。在充分利用其检索功能的过程中,人们赋予了检索另一个功能,即分析功能。索引的分析功能是在实践中衍生出来的,由于索引的最基本功能是检索,能为人们检索提供方便,而检索的目的在很多情况下是为了进行统计、分析,因此索引的另一功能也因此凸显出来,作为一种文献计量学的分析工具,在文献计量学分析中发挥重要的作用。文献计量学分析包括对文献数量、作者、机构、关键词的统计,以及文献之间的引证关系的分析,可以作为科学评价工具,广泛应用于个人、机构、地区、国家学术成果的评价;学科发展现状的了解及趋势预测;期刊的选择和评价;论文或著作的学术价值及社会影响力评价等。根据索引类型的不同,索引的第二功能主要表现在基于作者索引的文献计量分析,基于关键词索引的文献计量分析,基于引文索引的文献计量分析等几个方面,下面分别展开论述。
1.2 基于作者索引的文献计量分析
作者索引,即用作者姓名作为索引款目的标识系统。作者索引是非常常见的一种索引类型。根据著述方式的不同,作者索引可分为个人作者索引和团体作者索引。个人作者索引记载来源文献的个人作者信息,如作者姓名、作者署名排序、作者机构和来源文献号。该索引记录来源文献的所有作者,通过“来源文献号”与来源索引关联。团体作者索引主要用来存放来源文献中的团体作者。该索引记录了来源文献的所有团体名称、团体作者排序。也通过“来源文献号”与来源索引关联。作者索引以个人作者姓名、团体作者名称或作者机构为检索入口,针对于已知作者或作者机构的检索及分析,针对性强,方便快捷。
通过作者姓名或团体作者名称能够检索到某一作者或某一团体作者发表的文献,通过对其发表的文献的计量分析,可以了解某位或某些作者的论文发表情况,进而对相关作者的研究领域、研究主题、关注的焦点有所了解;以作者机构名称为检索入口,能了解某一机构的学术研究情况,了解其学术能力、研究主题分布等;通过对作者研究领域、研究主题的统计分析,可以将同一主题内的作者聚类在一起进行分析,以确定该领域、主题内的核心作者群;对这些核心作者的机构进行统计,又能分析出该领域、主题的核心研究机构;还可以用来分析著者间的合著率,等等。
1.3 基于关键词索引的文献计量分析
关键词是直接从文献的题目、正文或文摘中选出来,用以揭示或表达文献主题内容特征,具有实质性意义,未经规范化处理的自然语言词汇。用这种关键词做索引款目的标识系统,就称为关键词索引[2]。关键词索引一般分为两类:一类是带上下文的索引,如题内关键词索引、题外关键词索引、双重关键词索引等;另一类是不带上下文的索引,如单纯关键词索引和词对式关键词索引。关键词索引是一种传递索引,有着临时性、报道性的特征。关键词索引是一种以文献作者为中心的索引,因为关键词大都是由作者从论文篇名中抽出的不规范或只有少量规范的自然语言。虽然作者对于自己论述的主题是明确的,但对关键词的抽取则可能是陌生的、自由的甚至是随意的。关键词索引通常用计算机编制,速度快、简便容易,适用于快速报道文献和进行浏览性文献检索。
基于关键词索引的文献计量分析,可以对某个主题内的文献数进行统计,将相同的主题进行聚类,进而了解某个学术领域中研究的热点、焦点;通过对文献进一步统计分析,可以了解该领域内的学术带头人及带头机构;了解某一主题内学术成果情况(如发表论文),了解该主题的研究现状、发展趋势,等等。关键词索引这些功能的基础是其能揭示文献主题内容,使用关键词索引的优点在于它的临时性、报道性的特征,适于快速检索,缩短检索时间。然而,关键词索引在文献计量分析中也是有局限性的,这将在下文探讨。
1.4 基于引文索引的文献计量分析
引文,一是指引用资料,即在一部著作中引用其他作品的片段内容或他人所发明的定义定理;二是指参考文献,是指为撰写或编写而引用或参考的有关文献资料,通常附在论文、图书或每章、节之后,有时也以注释(标注或脚注)形式出现在正文中[3]。所谓引文索引,是一种以文献之间的引用关系为基础的文献索引,即它以被引用文献即引文为标目,其下列出引用过该文献的全部文献(来源文献)的检索工具[4]。它不仅具有一般检索工具收录的文献目录信息,并且收录了文献的引文(包括参考文献、脚注、附注)的目录信息,以及借助共引和文献耦合生成的相关文献的信息,这是一般检索工具所没有的。引文索引提供了多种途径的单项检索和组配检索,扩大了检索范围。
引文索引反映的是科研工作中对前人学术成果、经验的借鉴、继承和发展,同时也说明了先前的学术成果对后人的影响和渗透。引文索引是作者及学术研究成果的继承性和发展性的客观反映。因此,引文索引通过引用文献计量分析,研究引文的数量、文献类型、主题特点、时间及出处,能够了解某一作者、机构、地区、国家的学术研究现状和进展及其学术生产力情况;能够用于选择评价期刊,评价某一期刊的学术影响力;明确科研人员的文献使用习惯;并且对考察文献及著者的学术价值和社会影响有重要作用。通过分析文献引证和被引证的关系,揭示文献间的内在联系,了解学科间的联系点,从中挖掘新的学科生长点及其发展情况;了解学科、专业的历史及发展,研究热点和前沿领域,以及该领域内的学术带头人及其论著、带头机构等;以及某一学术观点的产生、发展、现状及趋势,以及对其的评论、修正等;评估某个作者、机构、地区、国家的学术影响力和学术地位;某项科研成果的发展现状、社会影响力及学术价值。
2 作者索引作为文献计量学分析工具的科学性与局限性
2.1 查找的快速性和直接性
作者索引的使用是十分方便、快捷的,作者索引中包含了作者的相关信息。如在CSSCI的作者索引中,包括了作者姓名、作者署名排序、作者机构和来源文献号等。只要输入作者姓名,即可直接查找,并获取所需文献。相比之下,分类途径检索依赖于分类表,先查找分类表,获取有关学科专业的分类号后,才能进行检索;如果得不到相应的分类号,就无法进行检索。主题途径检索依赖于主题词表或者叙词表,先查找主题词表或者叙词表,获取一个或多个能够表达检索课题的合适主题词或叙词后,才能进行单个词检索或者组配检索;如果得不到相应的合适主题词或者叙词,就无法进行检索。在进行分类途径检索和主题途径检索时,都必须考虑所需文献的学科专业属性或者概念词语属性。关键词途径检索虽然不依赖于分类表、主题词表或者叙词表,但在很大程度上取决于检索者选取的关键词是否与作者选取的关键词一致,为了达成一致,是需要花费一番脑筋的。作者途径检索可以不必考虑所需文献的学科专业属性或者概念词语属性,省略了分类途径检索和主题途径检索必须考虑所需文献的学科专业属性或者概念词语属性,省略了关键词途径检索的想词、找词的麻烦,只要有了作者姓名,即可直接进行快速检索,从而方便了文献计量分析。
2.2 查全率和查准率
较好就检索的查全率和查准率而言,通常认为,由于分类标引和主题标引的不一致性是客观存在的,所以,分类途径检索往往在保证了查全率的同时而失去了查准率;主题检索途径往往在保证了查准率的同时而失去了查全率;关键词途径检索的查全率和查准率均不及主题途径检索。相比之下,从理论上讲,一方面,通过作者途径所检索出来的文献是该作者发表的全部文献,除非存在着一人多名(对于中国现代作者而言,这种情况极少)或者被检数据库收录不全的情况,因而查全率较高;另一方面,通过作者途径所检索出来的文献都是该作者发表的文献,绝不会是同一领域中其他作者发表的,除非存在着同一领域的同名作者,因而查准率较高。作者途径检索具有比分类途径检索、主题途径检索和关键词途径检索好的查全率和查准率,来源于这个途径检索的直接性、不二性,因而,在一定程度上,可以保证文献计量分析的全面和准确。
2.3 必须预先知道相关作者
不同于关键词索引、引文索引等其他类型的索引,作者索引的检索对象是作者。因此,利用作者索引的前提是要对相关学科、专业、领域的作者预先有比较全面的了解。这种预先的了解能够使检索过程更为快速和直接,并且有利于克服同名作者给检索带来的额外负担。只有知道了相关作者的名称,才能直接使用该名称进行检索,快速、准确、全面地检索出自己所需文献,进而按照具体的要求对该作者所发表的文献进行统计,达到文献计量学分析的目的。相反,如果对相关作者一无所知,则很难利用作者索引进行检索。作者索引是针对作者而编制的索引,虽然具有自己独特的检索特性,但也存在必须预先知道相关作者名称的局限性。不过,一般地讲,同一领域的研究者对相关作者的名称预先是知道的,因而使用作者索引进行检索,通常不会存在困难。
2.4 同名作者的额外负担
使用作者索引时,不可避免地要遇到一名多人和一人多名的情况。就一人多名而言,由于在中国现代作者中这种情况极为少见,因而不会对作者索引的检索产生影响。而就一名多人(即同名作者)而言,在中国现代作者中这种现象并不罕见,因而会对作者索引的检索产生一定影响,也必然给排除同名作者增加了额外负担。然而,对于现代索引来说,解决这个问题并不难。一方面,通过数据库的作者途径检索,在检出结果中,除了包含作者之外,通常都会显示某一文献的全文、摘要和题名,对于同一领域的研究者来说,利用全文、摘要和题名来排除同名作者并定位自己所需要的作者并不难。另一方面,通过数据库的作者途径检索,在检出结果中通常也会显示作者所属机构甚至作者简介,这就为排除同名作者提供了更加便利的手段,而同名作者属于同一机构的情况则更是极为少见。对于同一机构中的同名作者,只能通过进一步调查、了解,从作者的研究领域、研究方向上做出判断。
3 关键词索引作为文献计量学分析工具的科学性与局限性
3.1 反映文献主题内容的科学性
关键词是从文献题目、摘要或全文中提炼出来的词语或词组,它是文献主题内容的反映。关键词具有高度概括性,并且是具有实质性意义的词,它能聚焦文献讨论的核心内容,将文献的主题框定在一个范围之内。因此,关键词基本上能够确定文献的主题,用关键词索引作为分析文献主题的工具是有科学依据的。
关键词能够揭示文献主题内容的前提是合理地标引关键词。为了使关键词的标引规范化,国家标准局颁布了一系列有关学术论文的国家标准,提出了对关键词选择的一些要求。关键词的选取一般应遵循以下几种原则。首先,应选择能准确反映文献主题内容的词作为关键词,关键词应通过对题名、摘要、全文的浏览进行分析提炼而出,准确把握文献的要点,关键词的选取尽量做到准确、全面。同时还应避免某些无检索意义的词的使用,如冠词、代词、连词、感叹词、副词、形容词和某些动词等,以及可以应用于多个研究领域中、没有特指意义的泛义词(或通用词)等,还应避免使用专业性的符号、英文缩写等。此外,还应注意关键词的排序问题,关键词需要按照一定的逻辑顺序排列,以利于反映文献的主题内容和便于读者浏览。如果文献作者都能够遵循选取关键词的标准,关键词索引的科学性毋容置疑。
3.2 揭示文献主题内容的局限性
关键词虽然能够从一定程度上揭示文献的主题内容,但是由于其短小精悍,并且数量有限,因此单凭几个关键词就完全了解文献的主题内容是不全面的、有局限的。同时,关键词表达主题的专指性、准确性较差,容易产生误检,因而利用关键词索引进行检索的查全率和查准率往往受到一定影响。特别是那些内容较为丰富、涉及范围较广、主题不是特别集中的文献,关键词在揭示文献主题内容上的局限性就更加暴露出来。比如,在利用关键词进行检索时,时常会出现这样的问题:有些内容不相关的文献却集中在一个关键词之下。其结果,检索出来的文献数量很多,但质量甚差,真正符合要求的文献很少,必须经过仔细筛选,才能得到符合要求的文献。可见,利用关键词进行检索也会出现检索质量低下、检索结果不符合主题等情况。所以,文献的主题内容体现在题名、关键词、摘要、全文中,唯有综合这几项进行全面分析、综合,才能透彻地了解一篇文献的内容,单凭关键词还不足以全面、准确反映文献的主题内容。
3.3 关键词使用的个体差异
与主题词不同,关键词是未加规范化的自然语言词汇。由于没有普遍进行词汇的规范化选择和控制,因而选词质量比较粗糙,存在大量同义词、近义词和多义词并存的现象。同一主题的文献可能分散在不同的关键词之下,而一个关键词之下也可能包含不同主题的文献,这些都是关键词本身存在的问题。而不同作者、不同研究者由于个体使用词语的差异,每个人的用词习惯、喜好不同,可能出现用不同词语表达同一含义的现象,这样就把同一内容的文献分散在不同关键词下,不能集中在一起。因而对关键词的选择和确定就成为关键词检索的核心问题。在利用某个关键词进行检索时,既要充分考虑它的近义词、同义词、多义词,又要考虑它的上位词和下位词及其相关词,才能获得较好的检索效果。
3.4 关键词标引的不规范性
目前,学术论文关键词标引不规范的问题是关键词索引用作分析工具的一大阻碍。虽然我国已制定了一系列有关学术论文关键词标引规范的国家标准,但由于多数作者对这些国家标准缺乏了解与关注,缺乏规范关键词标引方面的训练,致使我国学术论文关键词标引仍存在着许多不规范性,常见问题主要集中在几个方面:
(1)错标漏标。错标和漏标是关键词标引中常见的不规范之一。由于作者在选取关键词时,没有对文献的主题内容进行深入分析,草率地选取几个题名中的词作为关键词,忽略了摘要及全文中能够反映文献核心论点的重要词汇,造成关键词标引的遗漏。更有甚者,有的作者粗心大意,将关键词错标,使学术论文的严谨性打了折扣。这些会降低关键词揭示文献主题内容的科学性,造成漏检、误检,影响文献计量分析。
(2)选词不准。关键词标引的目的是为了解文献的主题内容提供参考,即使在未读全文之前就能对文献的主要内容有个大致的了解。标引关键词时应通过浏览题名、摘要、全文,正确理解和分析判断论文的主题内容,进一步提炼文献的主题概念。但有的作者在标引前缺少对论文主题内容的分析判断,选取关键词时抓不住论文的要点,选取的关键词不能准确反映文献主题内容。
(3)通用词。通用词是指不能揭示文献核心主题内容、对检索意义不大、可有可无的词,如“研究”、“分析”、“意义”、“影响”、“启示”、“趋势”等。这些词语对揭示文献特定的主题内容没有专指性,对检索几乎没有帮助,甚至会给检索增加无用功,导致文献的错检,降低查准率。
4 引文索引作为文献计量学分析工具的科学性与局限性
4.1 客观反映文献和作者的继承性
与以作者、关键词等作为标目而编制的索引不同,引文索引除了一般查询外,还能提供文献之间的内在联系。通过一篇被引论文,可以检索到同一领域不同时期的各个论文。每一篇新文献的诞生,都是作者在大量参阅前人研究成果的基础上,吸取其精华,并进一步深入研究、思考,最终提出自己观点的结果。科学的发展不是孤立的,而是在先前科学成果的基础上,发展和继承了曾经优秀的科研成果,并以此为出发点衍生出新思想、新成果。因此,科学的发展与继承本身是一个相辅相成的过程。引文索引能够将科学论文之间千丝万缕的引证和被引证关系展示出来,而这种关系正是科学本身的继承和发展关系以及学科之间的相互影响、相互渗透关系的反映。引文索引揭示的科学论文间错综复杂的引证与被引证的关系就像一幅“地图”一样,客观地揭示了科学技术发展的特殊变化规律与走向[5]。
4.2 定性与定量分析的基础
通过引文索引,对专业人员论著之间的引用与被引用的现象进行统计、归纳、比较、抽象、概括等分析,这是一个定性与定量相结合的过程。关于引文索引的定量评价特征,应该是毋庸置疑的。通过引文索引,对引用或被引用文献数量进行统计,从而达到计量分析的目的,体现了引文索引的定量特征。定性特征则表现在,引用文献的前提是要进行“同行评议”,选入引文索引中的文献必定是经过同行专家学者阅读、分析之后,承认它的价值,并引用在自己的文献中的,这个过程实际上就是同行专家学者对引文选择、评价的过程。此外,利用引文索引进行引文分析时,涉及到大量的统计数据和各种数学公式,但同时又需要对各种数据进行归纳、比较、抽象、概括[6],在这个过程中涉及抽象、比较等典型的定性分析方法。因此,引文索引用作文献计量学分析工具,不仅有定量分析功能,而且还有定性分析功能,将定性与定量相结合,能够更加客观、全面地发挥引文索引的分析功能。
4.3 数据的广泛性、开放性和客观性
引文索引数据是从大量的来源期刊中进行筛选、参考、利用的文献集合。其数量是巨大的,以CSSCI为例,自1999年创办以来,至2009年已累计6,000,000条来源文献数据和引文数据,仅2007年来源文献就达93673条,引文850,593条[7]。每年收录的22个学科的论文10万篇左右,其收录论文的作者包括国内外高校、科研机构、党政部门及其所属党校、行政学院等院校、军队、企业等各类机构等单位的人员姓名也在10万名左右。如此巨大的数据源弥补了数据中个别差错造成的影响,保证了引文索引数据的广泛性、客观性。
引文索引是一种量化了的分析工具,具有客观、公正、开放、透明等特点。然而,引文的前提是经过同行专家的阅读、认同,相当于一种同行评议,并且引文分析时归纳、比较、抽象、概括等定性方法的使用也充分体现了它的定性特征。引文索引将定性与定量相结合,弥补了单纯定量分析的缺陷,增加了引文索引数据的公正性。这种定性定量相结合的方式,使得引文索引数据更加客观、公正、开放,为利用引文索引进行文献计量分析奠定了基础,保证了其科学性和合理性。
4.4 使用范围的局限性
引文索引作为文献计量学分析工具,它分析的对象为学术成果,并且数据来源于学术期刊论文,不包含学术著作。它的研究对象、研究方法、研究工具和指标、研究成果主要是为学术研究服务的。因此,它的使用范围也应有严格的界定,特别是用作量化评价工具指标,主要适用于学术研究工作及其成果的定量评价[8]。它只能为同行专家定性评价提供一种互补的定量工具[9]。
另外,引文索引数据只是涉及学术研究成果中的很小一部分(即在部分学术期刊上发表的论文),完全排除了学术著作。而实际上,学术著作的引用比期刊上的论文更为广泛。所以引文索引即使用作学术评价的标准也是很有限的。
4.5 引文数据分析的滞后性
引文索引中的数据是由该学科领域内的专家学者对他人研究成果的阅读、分析、借鉴之后,将其作为引文运用到自己的文献中的。学术创作是一个严谨过程,作者需要广泛参阅相关文献成果,并且加以分析、思考,最后字斟句酌地精雕细琢而成。从文献的检索、收集到阅读、分析,再到文献的写作、完成直至最终定稿,都需要花费较多的时间,所以一篇文献能够作为引文被引用在文献中也是一个消耗时间的过程。在此之后,才能由索引机构进行整理、编辑、核对,由于数据量巨大,这一过程同样是非常繁琐的,并且需要相当的时日。
因此,由于受到各种因素的限制,引文分析存在严重的滞后性。这种滞后性限制了引文数据的利用效率,它不可能超前于同行专家的认证而存在和利用,这也是引文索引的一大局限性。Garfield在对被大量引用论文的被引用情况进行研究分析后,将它们的被引用时机情况归纳为五类:高速飞弹型、流星型、迟开之花型、双峰型和持久型[10]。可见,对于不同论文来说,其被引用的时机也是大不相同的,并呈现出一定的规律和特点。有的文献一经发表就立刻引起学术界的关注,被广泛引用,而有的则需要经过几年甚至更久的时间才能被关注,体现出它的价值。虽然不同论文被引用的时机不同,但由于引文索引被引数据分析的反馈性和滞后性,必须经过同行专家的审阅、认同、引用,才能在数据统计分析中被认证。
4.6 来源期刊学科专业的差异性
在选择期刊作为来源期刊为引文索引提供数据时,主要以期刊影响因子作为选刊的依据。由于不同学科特色迥异,学科性质、研究对象、研究方法也不尽相同,因而学术成果的表述习惯、表现形式也不尽相同,在引文中表现在引文数量、文献类型、文种的不同,在学科期刊中表现在期刊影响因子的差别。有些学科间期刊影响因子存在很大的差别,比如生物学、医学、化学类期刊的影响因子较高,而数学与工程技术领域期刊往往较低[11],甚至同一学科不同专业期刊之间也存在着影响因子的差异。而且对于研究领域广泛、研究内容丰富的大型学科,与内容单一、研究面窄的小学科,或者较为冷僻的学科相比,其学科期刊影响因子存在较大的差异,加之来源期刊数量的限制,使得某些较为冷僻的专业和小学科专业不能入选,这是有失公平的。
在入选不同学科专业期刊时,还存在一个时间跨度的问题。影响因子的一般定义只是近两年的期刊论文的被引数量与其刊载的文献总量的比值,时间段限定在近两年,容易忽视时间跨度对期刊影响因子的影响。比如,对于一些新兴学科和交叉学科,新技术的发展迅速带动着学科的进步,对于近两年的研究成果关注程度会比较高,文献引用率也较高,然而对于另外一些基础学科来说,其原理的发现可能需要几年甚至几十年的时间,需要时间的检验才能不断发掘出它的价值。可见,来源期刊学科专业的差异性给利用引文索引进行计量分析、科学评价带来的局限。
此外,随着科学技术和社会的发展,学科间的融合和交流日渐增多,跨学科跨专业层出不穷,这也决定了这些学科专业期刊的多学科性。如果一种期刊涉及多个学科,这种期刊就会被分别归为多个学科期刊排序表中,从而出现相关学科期刊因影响因子大而排在本领域主要专业期刊之前的不合理现象[12]。并且这些期刊刊载不同学科专业文献的比例不同,造成了被引数据的差异。同时,跨学科期刊在归类上是不确定的,随着期刊自身的调整、发展,期刊归类也可能发生变化,其被收录为来源期刊的可能性也发生着变化。
4.7 负引现象及被引强度的差别
引文是作者根据所写作文献的主题而进行检索、了解他人先前的研究成果,为了支持自己的论述而引用的文献和参考的资料等。作者引用的目的是为其论述提供背景依据、参考、数据支持等;或是用来突出强调他人的观点、对别人的研究成果予以承认;亦或是对他人的成果提出质疑,进行反驳、辩论或纠正等。因此,引文是作者对于被引文献的一种取舍或评价,这种评价既有正面的,亦有中性或负面的,因此可以将引文分成正面引文、中性引文和负面引文[13]。在文献引用类型中的“负引”,通常指的是批评性、批判性、反驳性的不同观点、意见的引用[14]。在利用引文索引进行文献计量分析时,正引和负引之间存在的差别是不可否认的,并且这种差别是引文数据本身难以区分和判定的[15]。由于负引现象的存在,虽说能够揭示其影响力,但是不足以反映文献的质量和创新能力。因此利用引文索引进行文献计量分析具有一定的局限性。
此外,被引文献存在着被引强度的差别。从引文深度上,可以分为深度、中度和浅度引文。有学者曾从引用形式上将引用分成“点对点、面对面、点对面、面对点”等四种引用类型[16]。其中,点对点引用,即来源文献引用被引文献的某一点来说明其论文中的一点;点对面引用,即来源文献引用被引文献的整篇来说明其论文中的一点;面对点引用,即来源文献引用被引文献的某一点来展开其整篇论文;面对面引用,即来源文献全面引用被引文献来展开其整篇论文。由于被引强度的差别,给学术评价造成一定的影响,评价时要综合文献内容进行全面的分析。
如果深入探讨引用类型和引用深度之间的关系,有研究表明:正面引用的数量随着引用深度的加深而增加,中性引用的数量随着引用深度的加深而减少,负面引用则呈中间大、两头小的分布。从数量上看,浅度引用数量最少,中度引用次之,深度引用数量最大。从深度上看,正面引用的引用深度最深,中性引用和负面引用的引用深度较浅。与深度引用相比,三种类型在浅度引用和中度引用上的数量差别较小,所得结果肯定了正面引用的有效评价作用。负面引用的引用深度比较低,绝大部分属于中度引用,浅度引用次之,深度引用最低[17]。通过对引用类型和引用深度之间关系的研究,揭示了引文中正面引用和深度引用的有效评价作用,能够从一定程度上评价文献的学术价值、影响力及创新价值等。而负引现象,或者是中度引用、浅度引用等,不能对文献的学术价值及创新价值做出评价。由此,在引文索引进行计量分析、学术评价时,不容忽视负引现象以及引用深度的差异带来的局限性。
4.8 影响因子在期刊评价上的局限性
影响因子是从引文角度测度期刊重要性及影响的一项参数,通常表示某种期刊中论文的平均被引用频率(Citation Rates),是指某刊被引次数与载文量的比值[18]。美国期刊影响因子原是为《科学引文索引》选择来源期刊(统计源)而研制的[19]。它作为一种计量指标被用来评价各类期刊的质量优劣,反映期刊的学术影响力。但是,用影响因子来评价期刊也存在着一定的局限性。美国科学情报所(ISI)指出影响因子在使用时(主要针对学术评价)应该慎重,必须考虑到期刊类型的不同、学科之间的差别、文献款目类型差别、自我引用的频率、期刊是否为ISI收录和期刊名称是否有过变更等诸多因素的影响[20]。
首先,影响因子只能用于评价期刊,而不能用来评价个人或机构的学术成果,这是由影响因子本身的特性所决定的。其次,影响因子的适用范围只局限在同学科期刊的比较。由于不同学科之间学科性质、发展历程、研究范围、研究方法的不同,导致了期刊影响因子不尽相同,甚至存在很大的差别。并且在不同业界间引用形态和倾向也是大为不同的[21]。比如,正在发展的新型学科和历史深厚的古老学科、理论研究型学科和应用研究型学科在引用动机和引用规范上有很大差异,一个大学科(有众多研究者或热门研究领域)和一个小学科在引用程度上也有较大差异[22],影响因子值因而也存在较大差异。如果只以影响因子作为期刊的评价指标,会对某些学科的发展造成不利影响。此外,期刊影响因子还受到期刊类型、期刊语种、期刊名称的变更、统计时段、统计来源数据库等多因素的影响。这些因素的作用,使得影响因子用于期刊评价结果的客观性、公正性受到影响。况且只利用期刊影响因子评价期刊不免有局限性,应该结合瞬时指数、总引文数、总论文数、引文半衰期等《期刊引用报告》提供的其他计量指标进行期刊的多维评估[23]。
5 结语
在信息化、数字化高速发展的今天,索引是帮助人们搜寻信息、有效利用文献的工具。在索引的两大功能即检索与分析中,与第一功能检索相比,索引的第二功能——文献计量学分析工具似乎更受到人们的关注。本文分别探讨了几种不同的索引类型:作者索引、关键词索引、引文索引的文献计量学分析功能,并总结了各类索引作为文献计量学分析工具的科学性与局限性。索引的文献计量学分析功能是有一定的科学依据的,但由于受到各种原因的限制,又表现出其局限性。在这些局限性中,有些是可以通过采取一定的措施进行克服或者避免的,然而有些则是索引自身的性质决定的,不能轻易消除。在今后的科研工作中,我们能做的就是充分利用索引方便快捷的优点,并尽量减少人为因素导致的误差,使得索引的文献计量学分析功能更好地用于科研当中。
参考文献
1 张琪玉.关于索引学研究和索引工作开展的设想与建[J].江苏图书馆学报,1993(1):3-7.
2 黄萍莉.关键词索引与主题索引比较研究[J].辞书研究,1994(2):77-82.
3 ,13, 16 叶继元.引文的本质及其学术评价功能辨析[J].中国图书馆学报,2010(1):35-39.
4, 6 叶继元.引文法既是定量又是定性的评价法[J].图书馆,2005(1):43-45.
5 罗式胜.我国文献计量学应用研究的突破——评《中国科学引文索引》[J].图书情报工作,1997(4):64.
7 叶继元,袁曦临.信息化条件下引文索引的信息精选与学术评价功能探析[J].图书馆论坛,2009,29(4):6-9.
8,9,10,14,15袁培国,吴向东,马晓军.论引文索引数据用作评价工具的科学性和局限性[J].学术界,2009(3):47-56.
11,18,20 符敏慧,张健兰.期刊影响因子和网络影响因子与科技期刊评价[J].情报业务研究,2004(8):120-121.
12 王艳,王婷.影响因子与科技期刊评价[J].新疆医科大学学报,2009,32(12):1769-1770.
17 王岚.中文人文社会科学引用性质与引用深度研究[D].南京:南京大学信息管理系,2009:39-40.
19 Eugene Garfield.The Agony and the Ecstasy-The History and Meaning of the Journal Im pact Factor.Presented at the fifth International Congress on Peer Review And Biomedical Publication.Chicago,September 16, 2005.
21 袁培国.期刊评价中引文索引几个亟待解决的问题[J].河南大学学报(社会科学版),2011,51(1):1-6.
22,23 赵文义.期刊影响因子的影响因素分析[J].科技与出版,2006(2):23-25.
王知津 男,1947年生,南开大学信息资源管理系教授、博士生导师,发表论文 320余篇,出版著作 29 部。
王 璇 女,1989年生,南开大学信息资源管理系情报学硕士研究生。马 婧 女,1989年生,南开大学信息资源管理系情报学硕士研究生。