国外索引工具的发展趋势
――以Scopus为例
邱均平 叶晓峰 熊尊妍
(武汉大学中国科学评价研究中心 430072)
摘 要 Scopus数据库是目前世界上规模最大的文摘和索引数据库,它的出现给国外索引工具的发展增添了新的色彩。本文以Scopus为例,对其从收录范围、检索方式、功能特点、服务方式等方面进行分析,探讨了国外索引工具的发展趋势。
关键词 Scopus 索引工具 发展趋势
0 引言
科技部下属的“中国科学技术信息研究所”从 1987 年起,每年以国外四大检索工具 SCI 、ISTP 、EI、ISR 为数据源进行学术排行。由于ISR(《科学评论索引》) 收录的论文与 SCI 有较多重复,且收录我国的论文偏少,因此,1993年起不再把 ISR 作为论文的统计源。而其中的 SCI 、ISTP 、 EI 数据库就是图书情报界常说的国外三大检索工具。
SCI ,即《科学引文索引》,是自然科学领域基础理论学科方面的重要期刊索引数据库,还被国内外学术界当作制定学科发展规划和进行学术排名的重要依据。ISTP ,即《科学技术会议录索引》,创刊于 1978 年,由美国科学情报研究所编制,主要收录国际上著名的科技会议文献。它所收录的数据包括农业、环境科学、生物化学、分子生物学、生物技术、医学、工程、计算机科学、化学、物理学等学科。EI,即《工程索引》,创刊于 1884 年,由 Elsevier Engineering Information Inc编辑出版,主要收录工程技术领域的论文。
除此之外,还有与三大检索工具相关的其他几个数据库:SSCI,即《社会科学引文索引》;A&HCI,即《艺术与人文科学引文索引》;ISSHP ,即《社会科学和人文会议录索引》。
一直以来,以上几种国外索引工具成为科研人员及高校研究生、图书馆进行引文研究和学术评价的主要依据。2004年荷兰数据库Scopus问世,号称是全球规模最大的文摘和索引数据库,并立即在网上掀起了“挑战SCI的数据库――Scopus”[1]的评论热潮,从此也给国外索引工具的发展和建设增添了新的元素,引发了一些关于索引工具发展趋势的讨论和思考。
在全球都在拼命出版一次文献数据库的时候, Scopus作为二次文献数据库为什么还能受到如此的重视? 为我国索引工具的建设和发展趋势又能带来什么启示呢?本文以Scopus为例,探索国外索引工具的发展趋势,谨为国际索引工具的建设提供一些参考。
1 Scopus概况
Scopus数据库是著名的Elsevier(爱思唯尔)公司于2004年底推出的具有强大功能的多学科参考数据库。其核心在于它是目前收集科学文献最全面的摘要与索引(A&I)数据库,是目前世界上最大的二次文献数据库。之所以取名为Scopus,是源于一种名叫PhylloscopusCollybita的鸟[2],这种鸟是世界上导航功能最强的鸟。Elsevier(爱思唯尔)公司用Scopus来命名他们的数据库,象征着它无比强大的检索功能和导航功能。
Scopus是由全球21家研究机构和超过300名科学家共同设计开发而成的。由学生、教师和研究人员进行超过了300次的测试。五位数据库开发人员和一位认知心理学家倾力合作,根据观察和对用户测试的反馈进行界面开发。图1显示了Scopus数据库功能和内容不断完善的历史演进过程。图1 Scopus 的历史演进
Scopus收录了来自全球4,000家科学出版公司的15,000多种同行评议科学期刊[3], 其中包括1,000多种开放期刊、500 种会议记录、超过600 种的商业出版物,125种书籍系列,覆盖物理、化学、数学、工程学、生命及保健科学、生物学、农业及环境科学、社会科学、心理学及经济学等研究领域。目前提供自1966年以来的2,700万篇文摘,每年新增110万条记录;以及自1996年以后的23,000万篇参考文献, 并且每日更新[4],每年新增记录2,500万条;33,000万条摘要,386,000万个科学网页,来自5个专利公司(美国专利局,欧洲专利局及日本专利局,世界知识产权组织,英国知识产权局)的21,000万条专利记录。
Scopus 推出仅3个月时间, 在全世界就有100多家图书馆正式签署了购买协议。到目前为止,中国已有100多所高校和科研机构试用Scopus。
2 Scopus的结构
从编排结构上看,Scopus统一了检索入口,主要包括检索、引文追踪、链接、个性化服务四大模块。其中检索模块提供四种检索途径:基本检索(Basic Search )、作者检索(Author Search)、高级检索(Adanced Search)和来源检索(Source);引文追踪包括文献被引追踪、自引追踪和期刊总被引追踪;链接包括出版商链接、摘要和参考文献链接、全文链接;个性化服务包括我的提示(My Alerts)、我的列表 (My List)、我的配置文件 ( My Profile)三个方面。图2是Scopus的页面结构流程图,以下对每个部分分别进行简单的介绍。
图2 Scopus 页面结构流程图
2.1 基本检索
基本检索(Basic Search)中,Scopus提供作者、来源名、篇名、摘要、关键词、所属机构、语言、国际标准刊号、国际期刊代码、数字对象标识符、参考文献、会议文献等12个字段以及AllFields、题名/关键词/摘要和题名/关键词/摘要/作者等两个联合字段,便于用户全面检索相关文献。Scopus对收录文献的特征标引得十分详尽,方便用户从不同途径查询所需文献。基本检索页面如图3。
图3 基本检索页面
2.2 作者检索
作者检索(Author Search)中,Scopus提供姓、名字第一个字母以及所属机构3个字段;此外,通过作者检索新增的“精炼检索结果”(RefineResults)功能,可以从来源期刊、作者机构、城市、国家和学科领域的角度对检索结果进行精炼。在作者详细信息页,可以对该作者文章被引用的情况进行追踪(Citation tracker),也可以点击“Show Documents”转到论文信息页面。作者检索页面如图4。
图4 作者检索页面
2.3 高级检索
在高级检索中,Scopus提供了题名、作者、来源文献名称和作者机构、All Fields(所有字段)、摘要、关键词、题名/摘要/关键词、题名/摘要/关键词/作者、国际标准刊号、国际期刊代码、数字对象标识符、参考文献、出版年代、卷等14个字段。同时还可以使用布尔逻辑运算符进行多个字段的联结检索,Scopus提供了AND, OR,ANDNOT, PRE/ 和W/ 五种运算符,如果对检索代码不熟悉,可以直接使用库里提供的标准代码,Scopus提供的59种检索代码基本可以涵盖全部的检索方式。高级检索如图5。
图5 高级检索页面
2.4 文献来源检索
在来源检索中,可以根据文献所属的学科领域来检索,Scopus在学科领域里面提供了27个学科字段;同时所有的文献以字顺排列在检索框下方,供用户点击浏览;也可以根据文献所属的类型检索,分为商业性出版物、期刊、会议录、丛书及All Sources 5个字段。来源检索的结果只能得到某个期刊、某本书等的整体信息,而不能具体到每篇论文。具体论文的详细信息需要通过其他方式来查看。文献来源检索(期刊浏览)页面如图6。
图6 文献来源检索页面
2.5 摘要及参考文献链接
摘要及参考文献链接是通过检索结果的论文信息结果页面来实现的。在每篇论文篇名的下方,都有“Abstract+Refs”、“Show Abstracts”链接按钮,点击按钮即可获得论文的摘要信息和相关参考文献信息,根据这些摘要信息和参考文献信息再进一步链接到全文。摘要及参考文献链接页面如图7。
图7 摘要及参考文献链接
2.6 全文链接
Scopus区别于以前国外检索工具的一个显著优势就是拥有强大的全文链接功能。通过基本检索和作者检索的结果页面都可以得到具体的论文信息,在一部分的文献下方的“Abstract+Refs”链接按钮后有“View at Publisher”(标准全文链接)按钮,点击即可在权限范围内获取全文。全文链接页面如图8。
图8 全文链接页面
2.7 引文追踪
利用Scopus查找文献引用和被引用信息的方法是:先执行一个基本检索(BasicSearch)、高级检索(Advancedsearch)或著者检索(Author Search)以获取一批源文献或期刊。在每篇源文献详细记录页面的上方提供“CitationTracker”链接,勾选需要查看引文信息的文献,点击“Citation Tracker”即可得到选定文献自1996年以来各年的被引次数列表。
还可以点击每篇源文献下方的“Abstract+Refs”可以得到摘要和参考文献页面,页面下半部分提供参考文献列表(Reference),即源文献作者所引用的参考文献;在页面的右方提供该篇文献的被引用情况(Cited by)。在这里可以看到其中3篇最新的施引文献。点击下方的链接,可以查看所有引用过该篇文献的文献列表。同时可以看到所有参考文献的被引用情况。在被引用情况下方提供“Alert me”按钮,可对这篇文献设立一个文献引文提示,如果这篇文献在Scopus中被引用,用户将得到电子邮件提示。引文追踪页面如图9。
图9 引文追踪页面
自引主要是对某个具体的作者而言,在作者检索的结果页面,点击“CitationTracker”进行引文追踪,在详细记录页面可进行自引追踪,查看该作者的自引信息。图10是自引追踪图示。
图10 自引追踪页面
2.8 个性化服务
Scopus数据库将个性化服务作为一个重点体现在其结构的各个方面,它提供信息通报服务 ( My Alerts)、我的列表 (My List)和我的配置文件 ( My Profile)。通过个性化服务,用户可以管理个人信息,定制个性化页面,保存检索记录,定制全文链接,接收最新引文信息和检索结果等。个性化服务页面如图11。
图11 个性化服务页面
3 Scopus的功能
3.1检索功能
检索功能是Scopus最基本的功能,它提供四种检索形式:基本检索(Basic Search )、作者检索(Author Search)、高级检索(Adanced Search)和来源检索(Source)。根据检索目的、检索内容和对象的不同,所采用的检索字段和方法也不尽相同,检索结果也随之改变。
3.1.1基本检索
在基本检索框输入检索字段,点击“Search”按钮得到检索结果界面,可以对检索出来的论文根据需要按相关性、作者姓名(字顺)、出版日期(升序)、篇名、被引次数进行排序。在基本检索的结果页面可以通过“View at Publisher”(标准全文链接)获取权限范围内的全文信息。例如,输入检索词“Informetrics”,字段限定为主题+关键词+摘要,检索结果如图12所示。
图12 基本检索功能实例应用
3.1.2作者检索
在作者检索框输入作者名,得到的结果页面可以了解该作者的出版历史,从作者姓名、发表文章篇数、发表论文所覆盖的期刊、所属机构、城市和国家6个角度识别并确定所关注的作者。点击论文数,可以查看其所发表的所有文章,或只查看其最新发表的文章(Show Last Title)。
例如,要检索情报学领域的专家“Ronald Rousseau”,首先在Last Name框输入“Rousseau”、Initials or First Name框输入“R”,点击得到所有Last Name为“Rousseau”、首字母为“R”的作者,然后通过“精炼检索结果(Refine Results)”选择国籍为“Belgium”,所属机构为“KHBO”,则可将结果范围进一步缩小,如图13所示。
图13 作者检索结果页面
在学科领域为Computer science的在作者姓名前的复选框打勾,点击citation tracker可查看到我们所需要查找的专家“Ronald Rousseau”的详细信息,包括该作者的姓名,被引文章,H指数,如图14。
图14 被引情况和H指数图
用户不仅能单独根据名字检索某一位作者的情况,还可以同时限定作者的姓名和作者的所属机构进行联合检索,该功能将很好地区分来自不同机构的同名作者,使检索更加准确、快速。
另外,还可以通过在高级检索页面输入作者检索代码:作者唯一标识AU-ID()、作者姓名首字母或Last name AUTH()、作者组合AUTHCOLLAB()、作者首字母AUTHFIRST()、作者关键词AUTHKEY()、作者的Last name AUTHLASTNAME()、作者姓名AUTHOR-NAME() 7种方式来实现一个或多个作者的检索,同样可以得到该作者的包括作者姓名、发表文章篇数、发表论文所覆盖的期刊、所属机构、城市和国家方面的信息。
3.1.3高级检索
如果所需要用到的检索条件比较复杂,用户可以直接选择高级检索,根据14个字段、5种逻辑运算符和59种代码互相组合,自主输入检索式,从而检索到满足条件的信息。
3.1.4来源检索
通过来源检索功能可以浏览不同领域的各种期刊、书籍、会议录和商业出版物,点击期刊名可以查看该刊物的详细信息,包括学科领域、出版商、ISSN、E-ISSN和起止年限,各年份刊登的文章数,点击“Citation tracker”可以检索到该刊物某个年份每篇文章自1996年以来的被引情况。
3.1.5专利检索
Scopus显示检索结果的方式与一般数据库检索结果的显示方式不同:分别从Scopus收录期刊、Web页面、专利以及混合结果等不同角度同时给出一组相互关联的检索结果,对检索结果提供整体的概观。点击“Patents”即可通过外连的专利数据库检索到与所检索主题相关的专利详细信息。
图15 专利检索详细信息
3.2 引文分析评价功能
Scopus的引文分析功能主要是通过检索操作的结果页面来实现的。Scopus是一种基于网络的综合性的科学文献检索工具,它具有强大的引文分析与科学评价功能。
Scopus可以为科学评价提供重要的数据源,帮助回答诸如以下这些问题:所查询的这篇文章至今被引用了多少次?最新的3次引用是在什么时间、被谁引用的?哪些论文是被引用最多的文献?某个作者的某篇文章或所有文章从1996年至今的引用情况如何?哪一年被引用的次数最多?这些问题的答案无疑是科学评价的重要指标之一。
总之,其引文分析与评价功能主要体现在下述5个方面:对科研成果的评价;对科学出版物的评价;对科学学科的评价;对科技人才的评价;对科研机构的评价。
3.2.1对科学文献的评价
在基本检索和高级检索的结果页面,每篇具体的文献都包含了篇名、发表日期、被引次数、来源出版物名称、著者,而且系统默认按“相关性”进行排序。其中的被引次数反映了该篇文献在Scopus中被他人引用的次数,同时还可以按被引次数的高低对文献进行排序,从而可以确定哪些文献的权威性较高、影响力较大。
图16 Scopus对科学文献的评价
3.2.2对科学出版物的评价
在来源检索的结果页面,通过“Citation Overviewed”按钮将刊物中所有被Scopus收录的文献的被引情况按照年代分别列出。用户通过这个功能,可以了解某种刊物的所有文献在1996年以来的被引情况,从而了解该刊物的总被引情况及具体某篇文献的被引情况,确定某种刊物或出版物的权威性。
图17 Scopus对科学出版物的评价
3.2.3对学科领域的评价
在高级检索页面输入某个学科领域名称,如检索社会科学领域,输入“SUBJAREA(soci)”即可检索到该学科的研究情况,包括发表文章的年份和数量、被引次数最多的论文、该领域的作者、期刊、文章类型等。点击“Cited by”即可将该学科领域的所有文章按被引次数由多到少排序,确定该学科的研究热点和趋势。
图18 Scopus对学科领域的评价
3.2.4对科学人才的评价
在作者检索的结果页面,利用引文跟踪器(Citation tracker)可以查询该著者发表文章的被引用期刊,只需在该著者发表文献前的选择框进行勾选,点击“Citation tracker”,结果将列出该著者所有被引文献列表、自1996年以来每年的被引次数和总被引情况;在著者姓名后,有包括著者自引链接。被引文献中只列出被引文献篇名,鼠标指到哪篇文章,右侧即出现该篇文章详细题录信息。文章列表右边则列出这些文献各年代被引情况列表,并将各年代被引数据进行统计汇总。同时,h-index以图表的方式提供科技人才个人科研绩效的评价。
作为评价指标,H指数考虑特定作者的出版记录、在某一时段发表的文章数量以及这篇文章的被引次数,其结果是一个简单的数字,即H指数(HighlyCited Index)。同时,为了帮助用户更好地了解文献之间的被引关系和作者的影响力,Scopus还提供了系列可视化帮助工具。通过这些可视化工具,Scopus可以为用户展示某一篇文章在某一时段被引模式的示意图,还可以揭示H指数是否依赖于少数几篇被广泛引用的文章,作者发表的文章是否相对稳定并不断被引用。
3.2.5对科研机构的评价
同样,在检索页面输入机构名称,选择字段为“所属机构”,即可获得该机构所有文章、作者、文章所属领域、出版时间等信息。根据这些信息可以有效的评价某个科研机构的科研竞争力。
图19 Scopus对科研机构的评价
3.3 链接功能
Scopus的内容之所以能够覆盖广泛,检索结果之所以能够更加全面,很大程度上归功于其强大的链接功能,包括出版商的链接,摘要和参考文献链接以及标准全文链接。
出版商的链接功能使得用户可以从Scopus链接到出版商的网页,从而在网页上获取标准全文。无论用户是否订购期刊,该链接均可显示。也可通过摘要和参考文献链接、标准全文链接直接来获取权限内的全文,在图书馆之间还可以进行馆际链接来获得全文。
4Scopus的特点与趋势
与其他的数据库和索引工具相比较,Scopus除了具备常规的基本检索,分析和评价功能外,还有自己的特点和优势,这些特点和优势也引领了索引工具发展的一种新方向,从某个角度体现了国外索引工具发展的新趋势。
4.1 内容全面化
4.1.1学科领域广泛
与以前的国外索引工具相比,Scopus所收录的期刊不再限制在自然科学、社会科学或工程技术某个单一的领域,而是全面覆盖了生命科学、保健科学、自然科学和社会科学四个大的主题类别。所收录的各个学科领域的期刊包括化学、物理、数学和工程学期刊5,500 种;生命科学及医学期刊5,300 种 (涵盖100% Medline的内容);社会科学、心理学及经济学期刊2,800 种;生物学、农业及环境科学期刊3,400 种(截至2007-10-1)。
图20 Scopus 收录四大类别的期刊种类数
4.1.2资源全面整合
Scopus有效的整合了网络资源,除了检索数据库收录的期刊文献外,还可以利用互联网上的搜索引擎,通过Scirus(www.scirus.com)可以从网络上获得2.5亿高质量的相关科技信息网页。可以直接从文章的参考文献链接到网站上的被引文章。另外,它还收录了互联网上免费的专利网站,如世界专利局,美国专利局,欧洲专利局及日本专利局。这些可以通过互联网获得的信息包括作者的主页、大学网站、公司信息、世界知识产权组织以及美国、日本欧洲专利局的信息等,从而大大扩展了文献信息的范围。
如在Search页面输入检索词“webmetrics”,即出现图21的检索结果页面。从图中可以看出,所有的检索结果中有16条来自Scopus,607条来自web,来自Patents的有3条。
图21 结果分类页面
继续点击“Web”或“Patents”可以进一步查看来自Web或Patents的结果的详细信息。如图22显示的是3篇关于webmetrics的专利文献的详细信息,中间部分的Refine Results包含了这3篇专利的机构、关键词,最底部的结果显示文献名称、作者以及摘要。可以选择不同的排序方式来列表显示结果,默认的是按“相关度”排序,文献题目可以链接查看全文。
图22 Patents结果详细显示
4.2 区域覆盖率均衡化
Scopus与SCI及其他几大国外数据库相比,收录了更多的亚洲文献和本地期刊文献,收录范围更加呈现出本土化趋势和各地区文献覆盖率均衡化趋势。数据库中超过60%的期刊来源于美国以外的国家和地区,而亚洲期刊的比例为10%,其中中国期刊占27%,包括500多种重要的中文期刊,如《力学学报》、《物理学报》、《中国物理快报》、《中华医学杂志》、《中国药理学报》等众多高品质的期刊。收录中国作者发表数量最多的160种期刊,53%没有被同类数据库收录,集中在工程、物理、材料、化学及医学领域,也有小部分文章来自于社会科学、决策科学、心理学、经济学、艺术和人文科学。
图23 Scopus收录期刊的地域分布
4.3 功能扩大化
Scopus不仅包括索引数据库常规的检索功能、引文分析和评价功能,还能有效链接到出版商、参考文献、摘要和全文,使研究可以更加深入和透彻。
当然全文链接有权限限制,不同的用户拥有不同的查看全文的权限。对于免费的和有权限查看的文章,只要轻轻点击,全文就能很快呈现在面前,全文链接可以从结果列表、摘要和参考文献中直接获得,从而更充分的利用图书馆的全文资源。“View at Publisher”是标准全文链接,“Abstract+Refs”是通过参考文献和摘要获取全文链接。
如果图书馆内有链接软件, Scopus则能够提供更加个性化的服务,即只显示用户所在图书馆已有访问权限的全文链接。如果不能获取全文的电子版,图书馆可以选择链接至该图书馆馆藏目录或者是用户指定的文献传递服务系统。用户就不必再为了搜索全文而浪费时间。Scopus包括已达数百G的电子存储的链接,可令引文和被引文献双向链接,使用户准确无误地获取相关文件。
View at Publisher标准全文链接通过交叉引用功能(CrossRef);对于未被CrossRef覆盖的800种期刊, Scopus建立了自己的知识链接库;无论是否订购期刊,链接均可显示;不保证用户都有权限访问全文;Full Text个性化定制全文链接图书馆可以选择只显示已定购期刊的全文链接;直接让用户了解是否有权限访问全文;可以通过Linkfinder-Plus和SFX实现这种功能。
4.4 服务个性化
Scopus的个性化服务贯穿整个数据库的各个方面,用户可以对个人信息、检索结果、个性化定制等随时按需要进行保存和修改,界面简单易用。
(1)我的配置文件 ( My Profile) 。点击 Scopus任何一个页面右上角的 Register 按钮, 可以通过个人真实信息的注册,获得用户名和密码, 建立一个个人配置文件。我的配置文件用来对个人信息和密码进行管理,注册的用户才能顺利使用数据库资源。
(2)我的列表 (My List)。通过注册,用户可以定制个性化页面、存储检索策略和定题服务以及引文跟踪服务。这些都可以保存在My List中。此外,Scopus还提供个性化定制的全文链接,即图书馆可自主控制的全文链接。图书馆可选择只显示已定购期刊的全文链接,也可选择链接到馆际互借 (ILL)或按篇付费(PPV)、馆藏书目以及其他电子资源,亦可不显示相关链接。
( 3) 信息通报服务 ( MyAlerts)。如果用户长期从事某一学科领域的研究, 需要及时掌握最新资料,则可建立定题通报服务申请。通过注册, Scopus 可以将读者的检索策略进行保存,并按用户的设置 (每天、每周、每次更新) ,定期将新的检索结果以题录或文摘的方式发至读者注册时所使用的邮箱。不仅包括检索内容的定期通报,还可以定期通报论文被引用的情况,从而可以实时的掌握所关心文献的最新被引情况,轻松进行该领域的动态追踪研究。
4.5 产品商品化
Scopus数据库由荷兰Elsevier(爱思唯尔)公司研究并推出市场,而且由于其功能强大,内容全面,相应的购买费用也较高,数据库产品继续以商品的形式出现并逐渐被人们尤其是研究人员所认可。由于这些工具在科学研究方面的重要意义和经济的不断发展,产品商品化也将成为未来国外索引工具发展的必然趋势。
5 结语
作为继国外三大检索数据库之后的又一大规模索引工具,Scopus虽为后起之秀,但其内容全面、学科广泛,能够提供数量庞大的相关文献,检索效果不亚于SCIE,同时运用互联网搜索引擎Scirus,还可同步检索科学网站与专利资料,文献源更加广泛;其丰富的检索字段和对检索结果提供整体的概观和精细的限定,不仅可方便用户从不同途径查询所需文献,而且有助于用户快速确认与其研究内容相关的文献。引文分析直接给出文章的总被引次数,清晰明了,简单易用;由于其收录的期刊数量多、学科门类齐全,令其在统计不同学科之间的互引量、交叉学科的内部联系等方面较具优势;尤其是收录更多的中国来源期刊,对于分析和评价国内科技论文、著者、研究机构的学术水平更具有实际意义。
从 Scopus 数据库的推出及其功能特点, 我们可以看出国外索引工具正朝着信息内容的极大丰富、检索系统智能化、集成化、超强的全文链接、易用性理念强化和个性化服务的方向发展。
参考文献
1 挑战SCIE的数据库Scopus.http://emuch.net/html/200506/97978.html,2005,06
2 http://lib.cumt.edu.cn/baojie/wlkj/Scopus_training.ppt,2005,04
3 http://www.scopus.com/scopus/home.url
4 http://info.scopus.com/overview/what/,2007,10
邱均平 教授、博士生导师,武汉大学中国科学评价研究中心主任,中国索引学会副理事长。