国外著名数据库收录中国科技期刊统计研究的意义和方法
――我与索引研究
鲍国海
(上海大学图书馆200444 )
摘 要 阐述了近年来所开展的国外著名数据库收录中国科技期刊统计分析研究的意义、条件和统计分析指标。
关键词 国外数据库 期刊来源索引 统计分析
树林中两路分歧,而我――我选择了较少人走的路,那改变了一切。
――弗洛斯特(Robert Frost,1875-1963,美国诗人)
《没有走的路》(The Road Not Taken)
在我1998年7月破格晋升副研究馆员后的近九年里所发表的论文中,有半数以上是与各类索引研究有关的,因此,我与索引有着不解之缘。
在这些论文中,有18篇是对国外著名数据库的期刊来源索引进行研究,专门对这些数据库所收录的中国科技期刊进行统计分析(见表1),这个研究领域已经成为我今后数年的研究方向之一。
众所周知,衡量科技人员的水平和贡献的高低大小是以他们公开发表的研究论文的数量和质量来体现的。科学巨匠牛顿曾经说过:“如果我们看得远一点,那是我们站在巨人的肩膀上。”这个肩膀指的就是前人发表的科学文献。
目前,国内对于期刊论文质量的评价,除了由同行专家对论文进行学术质量的评价之外,另外就是从论文是否被国内外数据库收录这方面来评价的,其中还包括他们发表论文的期刊是否属于核心期刊。其中,最受推崇的是美国的三大检索系统:《科学引文索引》(SCI)、《工程索引》(EI)和《科学技术会议录索引》(ISTP)。现在,每年由中国科学技术信息研究所的中国科技论文统计与分析课题组对上一年度被三大检索系统收录我国作者撰写的论文进行统计分析,并公布分析结果。有鉴于此,在国内的大学和科研院所对于本单位的科技人员和教师的考核、职务晋升、项目申报验收,以及博、硕士学位的申请等方面,都有其论文被三大检索系统收录的评价指标。因此,从上世纪90年代后期起,对于科技人员在国内发表的论文是否被三大检索系统收录,一直是图书馆参考咨询的内容之一。
从1999年起,我开始与本馆的周蓉硕士一起尝试对美国《工程索引》(EI)光盘数据库收录的中国科技期刊进行统计分析。从中了解了中国科技期刊被EI数据库收录的基本情况,其分析结果论文发表于《中国科技期刊研究》2000年第二期。后来,又与复旦大学图书馆的赵睿杰老师合作,对一些国外著名数据库收录中国期刊的情况进行了统计分析,至今已经分别完成了对美国EI、INSPEC网络及光盘数据库,ISI、MEDLINE、BP、SCOPUS、CA等网络数据库和MA光盘数据库的统计分析工作,其中有16篇这方面的文章发表于核心期刊《中国科技期刊研究》上(见表1),我还被列为该刊2003-2005年度的核心作者之一。其中有些论文已经被国内数家网站和期刊转载,有的还被用作期刊评奖,起到了积极的作用,有一篇论文被评为上海市图书馆学会2006学术年会优秀论文。
下面,就开展这项研究的意义、条件和数据分析方法略作介绍。
1 研究的意义和条件
1.1研究的意义
研究的意义包括现实和历史两个方面。从现实意义上看,首先,可以为国内科技人员的投稿提供指南,增加其论文被这些数据库收录的几率,也为其论文进入国际科技文献交流的平台提供了便利;其次,可以为国内文献收藏单位的文献采集人员提供期刊订购依据,因为,上述国外著名数据库均为书目型数据库,只能向读者提供文摘或题录信息,他们无法直接通过这些数据库获取原文;再次,可以为国内科技期刊的主办者和编辑提供其刊物被国外著名数据库收录的第一手资料,可作为其刊物提供国际化的一个重要指标。
从历史意义上看,这项研究可以为从事中国科技期刊史和科技史的研究人员提供第一手资料,因为中国科技期刊被国外数据库收录的历史,也是中国科技期刊的对外交流史。
1.2研究的条件
光盘和网络数据库的兴起为进行这项研究提供了必要的条件。传统的印刷型的检索工具如《工程索引》、《科学引文索引》、《科学文摘》、《化学文摘》、《金属文摘》和《生物学文摘》等虽然都有收录期刊表,但是,由于这些检索工具文摘正文大都为分类排列,我们无法对其进行精确的期刊收文量化统计。而出现于上世纪90年代的检索工具光盘和网络数据库则提供了按刊名、出版年、ISSN、CODEN码,为我们精确统计期刊历年的收文数提供了条件。
2 数据收集方法
2.1期刊的ISSN、CODEN码及英文刊名途径
利用中国科技期刊的国际标准刊号(ISSN)、CODEN码或英文刊名进行检索是获取相关数据的主要方法。刚开始收集数据时,我们首先利用EI光盘数据库的语言字段,如LA=CHINSES,然后,限定其出版年份,如PY=2001,在检索出相关的结果中,选取某种期刊的ISSN,然后采用总量排除缩小法,如:SI NOT ISSN=0567-7718。最后,通过这些已知的ISSN逐年检索具体刊物收录的数据。等到有了一定的中国科技期刊的ISSN积累之后,便可对其他数据库历年收录的情况进行逐年的试查。
2.2利用现成的期刊表
在进行统计分析时,我们还注意利用散见于各类期刊上的某数据库收录中国科技期刊列表和相关的网站信息,如美国《工程索引》中国网站(http://www.ei.org.cn)上就有列出了该数据库收录的中国期刊表。
2.3借助其他方法
通过本校科研处的老师,复印了中国科学技术信息研究所编制的《中国科技期刊引证报告:中国科技论文统计源期刊》,然后利用这些期刊的刊名,通过中国国家图书馆的IPAC系统,逐一查出刊物的ISSN号,然后,再根据这些期刊的ISSN号对这些数据库进行检索,又发现了一些以前没有查到的被收录期刊。
对于前来图书馆推销新数据库的专家,我们主动与他们联系,想方设法取得他们的帮助。如SCOPUS网络数据的一位女士,就提供了该数据库收录中国科技期刊的刊名和ISSN号;CA数据库的推销人员也对我们检索该数据库收录的中国科技期刊的方法进行了指导。
此外,在从事读者论文查收查引工作中,做有心人,注意向读者了解相关的信息,及时补充我们所没有掌握的中国科技期刊收录信息。
经过近九年的积累,目前我们已经收集了千余种中国科技期刊的ISSN和英文刊名,为今后开展统计分析研究打下了结实的基础。
3 统计分析指标
毛泽东曾说过:分析好,大有益。对于收集来的原始数据,分析手段的选择决定了研究成果的水平高低。对于这些数据我们是通过如下的分析手段进行的。
3.1期刊收录数据总量分析
对于每种国外数据库收录中国科技期刊的总量分析,可以了解该数据库历年收录中国科技期刊的论文数量和期刊数的变化情况。此外,还分别列出了在此期间内收录论文数量最多的前十种中国科技期刊表。
3.2收录期刊年(次)分析
所谓收录年(次)指的是某种中国科技期刊被数据库收录的每年的次数,通过这个指标,可以考察中国科技在该数据库的影响力。列出收录年次最多的前五种期刊的刊名。
3.3收录期刊学科分析
利用中国国家图书馆的IPAC,对这些被某数据库收录的中国科技期刊进行所属《中图法》分类号的统计,考察某种数据库收录中国科技期刊的学科分布。
3.4收录期刊的出版地区分析
利用中国国家图书馆的IPAC,检索出被这些国外数据库收录的期刊出版地,可以对被收录科技期刊的出版地分布进行分析。
3.5收录期刊的主办者分析
利用中国国家图书馆的IPAC,检索出被这些国外数据库收录的期刊主办者,可以了解这些期刊的主办者类型、数量和组成等。
3.6收录期刊的出版频次分析
利用中国国家图书馆的IPAC,检索出被这些国外数据库收录的期刊出版频次变化,可以了解被收录中国科技期刊出版周期的情况和发展态势。
3.7收录期刊的出版者分析
利用中国国家图书馆的IPAC,检索出被这些国外数据库收录的期刊出版者,可以了解被收录中国科技期刊出版者的情况,包括国内出版和国外出版等情况。
3.8收录期刊的创刊年分析
利用中国国家图书馆的IPAC,检索出被这些国外数据库收录的期刊创刊年,可以了解被收录中国科技期刊创刊年情况,这也是中国科技期刊史研究的一个重要指标。
3.9收录期刊的影响因子分析
如果这些数据库所收录的期刊是《中国科技期刊引文数据库》的来源期刊,则应分析其影响因子,但是该分析必须结合具体学科进行,否则就不具有可比性。
3.10这些期刊同时被其他数据库收录分析
由于统计数据库数量的不断增加,于是,我们还开展了同时被期刊数据库收录的统计分析,并且进行了相关度分析。这些数据库包括国外和国内数据库两类,如中国期刊全文数据库、万方数据库和重庆维普数据库等。
3.11收录期刊的出版语种分析
对被收录中国科技期刊的出版语种统计分析,可以了解中国科技期刊被该数据库收录的比例。
3.12这些期刊同时被其他数据库收录分析
了解这些期刊被其他数据库收录的相关指标,如与书目型数据库和全文型数据库的相关指标等。
3.13中国期刊与其他国家期刊的被收录的比较研究
如进行中、日科技期刊,中、印科技期刊被某数据库收录的比较研究,包括出版语言、学科等方面,可以了解中国科技期刊在某数据库的影响力。
表1 作者发表的国外数据库收录中国科技期刊统计分析论文一览表(2000-2007)
序号 | 作者 | 论文名称 | 发表刊名 | 发表年份、卷期页码 |
1 | 周蓉,鲍国海 | 1988-1998年美国《工程索引》光盘数据库收录中国科技期刊统计分析 | 中国科技期刊研究 | 2000,11(11):87-88 |
2 | 鲍国海 | 1990-1999年美国《金属文摘》光盘数据库收录中国源期刊统计分析 | 中国科技期刊研究 | 2001,12(1):25-26 |
3 | 鲍国海 | 1999-2000年EI数据库收录中国科技期刊的新变化 | 中国科技期刊研究 | 2001,12(5):344-345 |
4 | 鲍国海 | 1988-2000年美国《工程索引》光盘数据库收录的中国大学学报统计分析 | 中国科技期刊研究 | 2002,13(2):109-110 |
5 | 鲍国海 | 1989-2000年《科学文摘(SA)》光盘数据库收录的中国科技文献及期刊统计分析 | 中国科技期刊研究 | 2002,13(4):302-305 |
6 | 鲍国海 | 2001年美国EI光盘数据库收录的中国科技期7刊 | 中国科技期刊研究 | 2002,13(5):393 |
7 | 鲍国海 | 2000-2001年美国《金属文摘》光盘数据库收录的中国科技期刊的新变化 | 中国科技期刊研究 | 2002,13(6):419-493 |
8 | 鲍国海 | 2001年《科学文摘(SA)》光盘数据库收录的中国科技期刊 | 中国科技期刊研究 | 2003,14(1):31 |
9 | 鲍国海 | 1988-2001年美国《工程索引》光盘数据库收录中国科技期刊统计分析 | 上海高校图书情报工作研究 | 2003,13(2):53-57 |
10 | 鲍国海 | 1978-2002年美国《工程索引》网络数据库收录的确中国科技期刊统计分析 | 中国科技期刊研究 | 2004,15(1):38-41 |
11 | 鲍国海,赵睿杰 | 1969-2003年INSPEC网络数据库收录中国科技期刊统计分析 | 中国科技期刊研究 | 2005,16(1):38-39 |
12 | 鲍国海 | 1990-2003年美国《金属文摘》光盘数据库收录的中国科技期刊统计分析 | 中国科技期刊研究 | 2005,16(4):468-474 |
13 | 鲍国海 | 1961-2005年美国ISI数据库收录的中国科技期刊统计分析 | 中国科技期刊研究 | 2005,16(6):822-826 |
14 | 赵睿杰,鲍国海 | 1996-2004年BIOSIA Previews网络数据库收录的中国科技期刊统计分析 | 中国科技期刊研究 | 2006,17(2):216-219 |
15 | 鲍国海 | 1932-2005年美国CA网络数据库收录的中国科技期刊统计分析 | 中国科技期刊研究 | 2006,17(3):392-395 |
16 | 鲍国海 | Scopus网络数据库收录的中国科技期刊统计分析 | 中国科技期刊研究 | 2006,17(6):1069-1077 |
17 | 鲍国海 | Scopus网络数据库收录的中国地理学期刊 | 地理学报 | 2007,62(1):103 |
18 | 鲍国海 | 1949-2006年MEDLINE网络数据库收录的中国科技期刊统计分析 | 中国索引 | 2007,5(1):53-59 |
表2 国外著名数据库收录的中国科技期刊数
数据库名称 | EI 光盘 | EI 网络库 | ISI 网络库 | INSPEC 光盘 | INSPEC 网络库 |
收录年 | 1988-2001 | 1978-2006 | 1961-2004 | 1989-2001 | 1969-2007 |
收刊数 | 199 | 459 | 106 | 104 | 236 |
数据库名称 | MA 光盘 | BP 网络库 | SCOPUS网络库 | MEDLINE网络库 | CA 网络库 |
收录年 | 1990-2003 | 1996-2004 | 1965-2006 | 1949-2006 | 1932-2005 |
收刊数 | 142 | 106 | 340 | 174 | 1093 |
4 结论
通过近年来对中国科技期刊被国外著名数据库收录的统计分析,使得我们找到了新的研究领域。这也印证了这样一句俗话:留心处处是学问。
鲍国海 上海大学图书馆副研究馆员。