中文社会科学论文被引检索个案的测试与分析 庄 琦
发布时间:2018-09-25  浏览次数:75

中文社会科学论文被引检索个案的测试与分析

  

(上海交通大学图书馆  200030)

        就中文社会科学引文方面的情况进行一次检索测试,试图从一个侧面揭示国内中文引文数据库的一些现实状况。

关键词  中文社会科学论文  引文索引  被引情况

 

    近年来,国内对引文索引与论文质量评定问题的关注程度不断走高,反映学术论文质量的平均被引频数问题受到重视。

例如:2004年3月12日《人民政协报》上刊发了新华社记者刘江的文章《假如陈景润被量化考核――人大代表质疑定量考核》,其中就有如下报道:万锦堃透露说,他们最近向清华大学递交了一份《中国学术期刊引证报告》,提出“综合评价梯度”的概念,建议考核研究成果不再以是否在核心刊物发表为依据,而通过综合考察论文的被引用次数、网上下载率等指标,进行更科学的评价――清华大学已表示,将完善现有的评价体系,充分考虑文科与理科、基础性学科与应用型学科等的不同特点,全面评价教师的学术成果。

同时,国家科技部、教育部、中国科学院、中国工程院、国家自然科学基金委员会联合也制定和下发了《关于改进科学技术评价工作的决定》,对科学评价工作提出改进意见,其核心是提倡科学论文内在价值的判断。因此,科学地作好引文的计量评价,已成为一个十分重要的问题。

不容忽视的是,以往高校、科研院所在科研人员的考核、晋级、职称评定中存在以论文的数量作为衡量科研成果的标准之一,因此出现单纯追求论文的产出数。而近年来,忽视论文质量的现象正在改变。

我们知道,引文分析可以客观地反映论文在某一时期内的被引用情况,因此可以作为评价论文质量的方法之一。国内高校、科研院所等学术机构在科研人员的考核、晋级、职称评定中上报的发表论文被要求注明被SCI、EI、SSCI等收录、被引,或被国内中文引文数据库收录、被引情况等。

SCI、EI、SSCI等国际公认的引文索引的知名度和影响力在国内自然已受到足够的重视。那么,国内中文引文数据库的情况又如何呢?出于这方面的考究目的,笔者前不久就中文社会科学引文方面的情况做了一次检索测试。具体说是于2005年2月28日就图书情报行业的某著者(为避免不必要的麻烦,本文暂且用著者A来表示)的论文被引情况作了一次实际的检索测试和分析。

1  从《中文社会科学引文索引(CSSCI)》中查询

  1.1  选择“中文社会科学引文索引”(CSSCI)作为查询首选是因为该索引是国家教育部批准立项的重大研究项目,由“南京大学中国社会科学研究评价中心”承担。具有科学性、权威性。

  1.2  通过“被引文献作者:著者A/被引文献类型:期刊论文/时间跨度为1998-2003年”的途径检索,命中结果6篇,总计被引6篇次(其中1998年、1999年、2001年、2002年各被引1篇、2003年被引2篇)。

以上共计6篇不存在重复现象。2  从《中国期刊全文数据库》中查询

(1) 清华大学和清华同方曾在《中国期刊全文数据库》以及《中国知识资源总库》建设的基础上,作出了中国学术期刊综合引证报告,在全国第一次全面给出了我国学术期刊的文献计量学评价指标,覆盖了我国约6000种期刊。专家表示,这意味着几乎所有在国内期刊上发表的文献都能够很准确地查到它在国内期刊被引用的情况。毫无疑问,利用清华同方的《中国学术期刊全文数据库》来查检被引情况也是必不可少的。

(2) 为参照《中文社会科学引文索引(CSSCI)》目前发布数据的时间跨度为1998-2003年,所以第一步的检索策略为:“检索项:引文/检索词:著者A/时间跨度为1998-2003年”。命中结果为11篇(其中1998年被引3篇、1999年被引3篇、1999年被引1篇、2002年各被引4篇、2003年被引3篇)。

(3) 由于《中国期刊全文数据库》目前发布数据的时间跨度为1994-2004年,所以第二步的检索策略为:“检索项:引文/检索词:著者A/时间跨度为1994-1997年”。命中结果为3篇(其中1995年、1996年、1997年各被引1篇)。

(4) 由于《中国期刊全文数据库》目前发布数据的时间跨度为1994-2004年,所以第三步的检索策略为:“检索项:引文/检索词:著者A/时间跨度为2004年内”。命中结果为1篇。

3  从《万方数据》中查询

从引文索引途径查询:命中结果为7篇(其中1998年被引1篇、2003年被引4篇、2004年被引2篇),但是2003年被引的4篇中有1篇是重复计算的,所以实际总命中结果应为6篇。

4  从人大复印报刊资料中查询

从检索词:著者A的途径查询,经仔细辨认,命中结果13处中有2项涉及为被引(其中2002年和2004年被引各1篇)。

从以上检索结果,我们可以得知:目前,要检索国内中文社会科学期刊论文被引情况至少可从上面四个数据库(虽然《万方数据》是偏科技类而非社科类的,但由于学科交叉等原因,也会偶有兼收)中去查检(当然不排除其他一些检索途径)。

5  分析与比较

  5.1  时间跨度与更新速度

《中文社会科学引文索引(CSSCI)》目前公布数据的时间跨度为1998―2003年。

《中国期刊全文数据库》目前发布数据的时间为1994―2004年。

《万方数据》中“中国科技论文与引文分析数据库(CSTPC)”的发布数据的时间跨度为1989―2004年。

《人大复印报刊资料》目前发布数据的时间为1998―2004年。

需要提及的是,《中文社会科学引文索引(CSSCI)》的更新速度实在太慢,直到本文交稿的2005年5月10日,CSSCI公布数据的时间跨度仍为1998―2003年。而其他几种更新速度则明显要快。笔者注要到:在《万方数据》中检索到的著者A的被引6篇中至少有1篇是源于CSSCI收录的同样刊种,而由于CSSCI更新速度慢,尚未能检到。

  5.2  来源期刊的选定和代表性、覆盖面及权威性

CSSCI的指导思想是:入选的期刊必须是社会科学领域内各个学科中学术水平较高、社会影响较大、编辑出版较规范、且能体现各学科最新研究水平的重要学术刊物。最初,CSSCI选用了中国大陆出版的中文人文科学、社会科学学术期刊四百余种。虽在不同的年月小有变动,但基本上不超过五百种。可以说,CSSCI是在一个较高层次的收集和揭示。相比较而言,《中国期刊全文数据库》是在一个广泛、全面的范围内收集和揭示,两者是完全不同的。它们将分别满足于不同的需求。

这一点,在前面的检索结果中就明显反映出来了,同一著者、同一时段,被引检索的数量结果就完全不同。由此,由于上述引文数据库触角的不同,就收集和发布数据的结果来看,互补有无、拾遗补缺是提高查全率所必需的。例如,在以上检索案例中,从《人大复印报刊资料》中虽已检到2篇,而其中1篇却是其他数据库所未收录的。

在以往的检索实践中感觉到,《中国期刊全文数据库》、《万方数据》在检出结果中数据重复的现象是很多的,但近年来情况大有好转。

需要说明的是,在上述测试分析中,笔者在引用次数的计算中剔除了自引的情况。

以上只是一个小小的实例而已,要全面掌握这方面的情况,需要探索的很多。


    上海交通大学图书馆副研究馆员,中国索引学会常务理事,上海市高校图工委秘书长。