信息化条件下引文索引的信息精选与学术评价功能
叶继元
(南京大学信息管理系 210093)
1 信息爆炸与信息焦虑、信息饥渴
1.1 文献信息资源的增长
文献信息资源包括印刷型信息资源、缩微声像型信息资源和数字化信息资源(原为机读型信息资源或电子信息资源)。2007年中国出版的图书已达248283种,其中新书136226种;世界各国出版图书约百万种。国内出版期刊约 9468种,世界各国出版期刊约18万种。国内出版报纸1938种,世界上共有报纸10万余种,现期报纸6万余种。中国现有研究生42.4万人,其中博士人数已超过5万人,已位居世界第1位。博士论文、专利文献等更多。
1.2 网络资源的增长
据网络新闻报道,2002年一年的全球信息可填满50万个美国国会图书馆。2007年12月,我国网民数已达到2.1亿人,网页总量已达84.7亿个。按照网民平均每分钟看完一个网页计算,如果一个人不眠不休地阅读,那么读完这些网页需要1.6万年还多;假如按照每个网页都打印成一张普通的A4纸计算,那么它们摞起来的高度大致相当于从北京到长春的路途。
截至2008年6月30日,我国网民数量达到2.53亿,首次大幅度超过美国,网民规模跃居世界第一位。但是普及率只有19.1%,仍然低于全球平均水平(21.1%)。目前全球互联网普及率最高的国家是冰岛,85.4%的居民是网民。其次是美国,为71.9%。
1.3 信息焦虑、信息饥渴
据2004年美国一项研究报告称,因特网上每天有5000万网页是新添加或被修改过的。所有网络信息中有30%内容淫秽,30%内容重复。据2007年中国互联网信息中心报道,网民对网络新闻的相信程度为51.3%,不相信的为41.4%,一般的7.3%。
学术信息也存在类似情况,过多重复与缺漏同时存在。
综上所述,可见信息精选与评价的必要性、重要性。
1.4 信息精选与评价的根据
1.4.1 全信息理论
综合地考虑信息的形式因素(语法信息)、含义因素(语义信息)和效用因素(语用信息),即为“全信息”。研究全信息的本质、全信息的度量方法以及全信息的运动(变换)规律的理论被称为“全信息理论”。该理论引入主观因素、非形式化的因素和模糊、混沌因素,重视主观与客观相互作用、非形式化和形式化有效结合,强调用新的科学观、新的方法论和新的数学工具研究信息的本质。
1.4.2 信息构建理论
信息构建(IA: informationarchitecture)理论是旨在满足用户信息需求的新的理论构想。IA从一个新的角度,重新构建和整合了有关知识,较通俗地解释了信息爆炸情况下信息的收集、标引、分类和利用等问题,并对网站门户、各种数据库的信息组织和利用的实践具有较强的指导作用。例如,IA的五规则就对数据库的精选信息和精选期刊有指导意义。如规则4:确信哪些信息值得保留,你真正想要了解哪些信息;规则5:大多数信息是无用的,要勇于放弃无用信息。
1.4.3 文献计量学几个定律
布拉德福定律、引文定律都是精选信息的根据。
2 引文索引的精选与评价实践分析
2.1 ISI,SCI,SSCI,A&HCI
谢泼德引文(Shepard's Citation)。美国1873年出版的一种供律师和法学家查阅法律判例及其引用情况的检索工具。它是引文索引的先驱。由美国律师谢泼德创制。它以早先的判例为线索,分别引出后来引用过这些判例的其他判例。
2.1.1 科学引文索引(SCI:Science Citation Index)
1960年代由美国著名情报学家尤金・加菲尔德(E. Garfield)编制。一种以自然科学文献之间的引证关系为基础的文献索引。它利用文献中普遍存在的参考引证现象,为人们提供了一种新的文献索引方法,可以从来源文献查到该文献引用了哪些他人写的文献,也可以从被引用的文献查到哪些来源文献引用过它。它以被引用文献即引文为标目,其下列出引用过该文献的全部文献(来源文献)的检索工具。它不同于从作者、题名等为标目而编制的索引,除了一般查询外,它能提供文献之间的内在联系。通过一篇具体的被引论文,可以检索到同领域的不同时期的各种论文。
2.1.2 引文索引发展概况
加氏所领导的美国科学信息研究所(ISI)于1963年创办了《科学引文索引》后,1973年、1978年又分别创办了《社会科学引文索引》(SSCI, Social Science Citation Index)和《艺术和人文学科引文索引》(A&HCI, Art & Humanities Citation Index)。
现已整合成Web ofKnowledge。
据报道,美国Thomson公司ISI Web of knowledge ,涉及22000 peer reviewed journals, 《期刊引用报告》(JCR :journal citation report )收录世界自然科学学术期刊5752种;2007年SCI,SSCI和A&HCI共9300种来源期刊。
Thomson ISI 的宗旨:“Thomson Reuters has been anestablished leader in providing access to high-value, essential information forresearchers and scholars worldwide for over 45 years. Our goal is to increase theimpact of research by empowering researchers with the information they need toaccelerate discovery.”。
2.1.3 SCI(科学引文索引)对信息的精选
ISI执行副总裁文森特・卡拉赫针对一些全文数据库也做引文数据库,ISI如何面对这种挑战的提问时说:“我们已有45年的实践经验,而且我们的技术也非常领先,另外,我们认为对内容的选择非常重要,并不是所有的内容都是需要去索引的,我们始终要提供最好的信息资源和一些核心的研究成果。这方面我们也是非常独特的。”
2008年汤姆森路透科技信息集团执行副总裁Keith MacGregor说:“汤姆森路透集团始终致力于为全球科学界提供准确的情报信息,同时为发明和研究评估工具树立全球标准,以便科学家可以加快并优化其科研工作。
SCI的选刊标准包括很多因素,如期刊的被引次数和影响因子,发表哪些国家的论文,被哪些国家的论文所引用,是否遵循国际通行的编辑惯例,被引文献的文献项目是否齐全,每位作者有否完整的地址(包括电话号码与传真号码),是否有英文撰写的能提供一定信息量的标题、文摘和被引文献,是否采用同行评议方式审稿,所载论文研究结果是否具有新颖性,是否反映新的科学进展,期刊编辑委员会及论文作者是否具有国际影响力,新办期刊的主办单位是否具有声望,期刊是否具有地区代表性等。
2.2 中国引文索引概况
20世纪90年代末,中国科学院文献情报中心、南京大学中国社会科学研究中心分别研制了《中国科学引文索引数据库》(CSCD)和《中文社会科学引文索引》(CSSCI)。
台湾也研制了TSSCI。
专门学科引文索引,如中国警察、公安引文索引。
2.2.1 CSSCI的发展
�1995年,南京大学就正式出版专著论证研制文科引文索引的必要性和可行性;
�1997年提出研制CSSCI《中文社会科学引文索引》的计划;
�1998年上半年被作为重大项目在南京大学正式立项;
�1999年南京大学与香港科技大学签订了共同研制、开发CSSCI的协议;
�同年教育部正式将CSSCI列为重大研究项目;
�2000年2月以CSSCI为主要产品的南京大学中国社会科学研究评价中心成立;
�2004年被评为“985二期工程”南京大学中国人文社会科学评价国家创新基地。
9年来,评价中心与基地依托南京大学图书情报学科的雄厚势力,发挥情报学、图书馆学博士点的优势,在CSSCI数据库基础上,出版了一大批有关图书、期刊、论文、机构、作者评价的研究成果。
2.2.2 评价中心的组织结构
�2003年7月,南京大学明确了中心“实行事业单位企业化运作”的管理体制;
�中心是学校直属的、院系级的实体性研究机构,设立专职的科研和行政人员编制和独立的科研、办公、资料室用房;
�目前中心下设咨询部、数据部、项目部、技术部4个部和一个办公室。现有专兼职研究人员12名,数据制作和行政人员20余名。
2.2.3 评价中心的工作
1)加强数据质量(2007年来源文献93673条,引文850593条);
2)开展咨询服务;
3)组织学术会议和开展期刊规范化等培训;
4)开展国际交流;
5)研究国家和教育部重大课题。
2.2.4 编制CSSCI就是精选学术信息
�提供论文数据与引文数据;
�推动学术期刊及学术规范化;
�文献检索;
�科研分析;
�评价参考。
2.2.5 CSSCI来源期刊如何评选
CSSCI的来源期刊评选的标准主要有三个:
1)期刊出版的规范性;
2)期刊的被引用情况;
3)专家意见。
2.2.6 CSSCI指导委员会
“CSSCI指导委员会”是由全国16所高校的17位社会科学专家和社科管理专家组成,其主要职责是对CSSCI的评审标准和原则、管理中的重大事项等作出审定。
2.2.7 CSSCI来源期刊及各学科来源期刊数量的确定
�根据布拉德福文献集中分散定律、加菲尔德引文定律及二八率,并参照美国引文索引选用期刊的比例,结合我国社科学术期刊及各一级学科期刊种数、科研人力数来确定。
�目前我国正式刊行的人文社科学术期刊2770种,其来源期刊数是期刊总数的20%左右,根据CSSCI指导委员会的意见,2008年来源期刊528种,扩展版152种,来源集刊86种。
2.2.8 CSSCI来源期刊评选原则
�分类评价原则;
�动态原则;
�定性定量结合原则;
�公正公平公开原则。
3 引文索引学术评价功能的反思
3.1 引文的本质分析
引文(citations)也叫参考文献(bibliographic references),是指为撰写或编辑论著而引用或参考的有关文献资料,通常附在论文、图书或每章、节之后,有时也以注释(附注或脚注)形式出现在正文中。严格说,二者有区别。
参考文献类型:
�一种是只列出某一著作(原著)中引用的各种著作及论文(称为引文)的题名、作者等,不标注引文在原著中的出处、页码,这实际上是参考书目,是对某一著作或论文的整体借鉴或参考;
�另一种则是既列出题名、作者等,又列出出处、页码,有的工具书称之为引书引得,有的称为文献注释、文献引文注释、文献引证注释等,这实际上是严格意义上的引文。
引文(citations,reference)与注释、文献注释有异同。引用意味作者认为引用文献对自己的研究“有用”。引文的主要作用:(1)有助于传承研究成果;(2)有助于读者、编辑查核文献;(3)有助于节约正文篇幅;(4)有助于评估学术水平(既有定性亦有定量,先“主观”,后“客观”;正面、中性、负面引用)。
3.2 引文索引的功能
�提供论文数据与引文数据;
�推动学术期刊及学术规范化;
�文献检索(原为主要作用);
�科研分析;
�评价参考。
3.3 引文索引对评价的影响
�有利于形成统一的评价平台;
�有利于获取较准确的评价统计数据;
�有利于获取较权威的评价统计数据;
�有利于提高获取评价统计数据的效率。
3.4 学术评价的本质分析
�学术研究的目标多元;
�学术研究的内容多样;
�学术研究的层次不同;
�学术研究的深度不一;
�学术研究评价的多样性与复杂性。
学术评价是一种价值判断,是评价主体,即同行专家群体对研究好坏、高低、深浅、对错的说明。
3.5 引文数据与学术评价的关系
�引文数据与研究影响有较大关系;
�与质量好有一定关系,但没有必然联系;
�引文数据对学术评价有一定参考价值;
�引文数据对学术评价有局限性,不能夸大、或过分使用其评价功能;
�引文数据必须与精审的同行专家结合使用;
�引文及引文索引的质量与精审专家的选择是评价的核心问题。
3.6 引文索引及其研究的走向
�更加重视对引文本质等基础理论问题的研究;
�更加重视对引文规范化的研究与实施;
�更加重视引文评价法与专家评价法等方法的结合;
�更加重视引文索引与全文库的结合;
�更加重视引文索引编制的质量和应用。
4 结语
只有驾驭信息、精选信息、评价信息,才能更好地利用信息。
叶继元 南京大学信息管理系教授,中国社会科学研究评价中心副主任,中国索引学会副理事长。