与网络结合、与数字图书馆结合
方燕虹
(华北电力大学图书馆 北京102206)
摘 要 本文论述在文献的载体形式发生革命性改变,图书、印刷版文献数字化的进程日益加快的今天,索引如何与数据库结合、与网络结合。
关键词 索引 数据库 网络 数字图书馆
1 印刷版索引的传统作用
索引是学术研究人员乃至广大读者不可缺少的重要工具。任何一项科学研究工作几乎都无一例外地要从查找资料入手,随着科学研究工作的日益复杂,其对索引的依赖性就日趋增强。
索引也是茫茫书海的航标,是读书治学的工具,更是科技工作不可缺少的利器。各种索引都有其相应的专业导航作用,例如,只要读者熟悉和掌握对口专业的个人或团体著者的姓名及其工作单位,就可以分别利用著者索引、团体著者索引、著者所在单位索引等,迅速得知各国的专家、学者、知名人士最近在研究什么,确立了哪些科研课题,取得了多少科研成果,发表了何等高见,获得了几项专利发明等等信息,以此来拓宽思路,迸发出更多创造性的思维。
索引还是文献和读者之间的一道桥梁,是科学知识、理论研究和科学发展成果的一种传播媒体,读者能够从众多的索引中,总结和预测出社会在某个时期某个方面的发展现状和方向。例如:(1)题录索引。可供读者从时间、类别和篇名入手,寻找有关文献的线索,以研究某一作者的学术思想或科研成果,考察某一学科领域的研究方向、水平或某一事件的史料。(2)专题索引。这个索引是在传统目录学的理论基础上发展起来的,它不仅具有传统的目录学的指导读者治学功能,在目前文献激增的情况下,它突出的作用就是为读者科学地揭示和报道文献信息,促进文献交流。文献呆在那里数量再多,意义也不大,只有在交流、传播中才能体现出它的价值。专题索引特别是对于研究人员来说更有利。当他们进行一项专题研究时,专题索引可以帮助他们在浩如烟海的文献资料中,花很短的时间得到他所要寻找的资料线索。(3)引文索引。是从被引论文去检索引证该论文的文献。这种索引从文献之间相互引用这一关系的角度,提供了一种新的检索途径。在文献检索中,不但可以用它来了解一篇文献的影响与效果,而且可以掌握相关情报信息。从该索引中还能统计出作者的论文被引频率,从而了解某一专业的专家情况。
传统的纸质索引最有影响力的有《全国报刊索引》、《中国学术期刊文摘》、《中国丛书综录》等等,还有各种专业索引、图书索引(书后索引)等。
2 电子版索引:数据库和索引的结合
数据库以及网络技术发展的今天仍然需要索引。文献的数字化最早也是从索引开始的,最早的数据库是文摘型索引数据库。国外发展得最完善的最有权威性的索引数据库有Dialog数据库、EI数据库、Scopus数据库等。特别是由美国ISI公司创始于20世纪60年代初的科学引文索引(ScienceCitationIndex,SCI),经过多年的演变与沿革,已从单纯科技领域扩大到基础研究的所有领域(包括人文、社会科学);从单纯印刷本扩展到光盘版、联机版和网络版。这一大型索引的出版和发行,在一定程度上提供了科学研究文献检索和引文分析所必需的大量数据,成为国际公认的反映基础学科研究水准的代表性工具。这些索引数据库涵盖了全球所有科技文献。而且各种索引体系完整,数据准确,为全世界的科技工作者提供了丰富的参考资源,也为期刊的评价提供了科学依据。90年代国内也开始制作自己的中文索引数据库,有维普的《中文核心期刊篇名数据库》、《中国近代期刊篇目数据库》、《全国报刊索引数据库》等等。这些索引数据库的出现,使得利用索引从原来要翻阅索引书籍到只需按几个按钮就可以完成,为科研工作者提供了更加快捷、便利的条件去获取文献资源的信息,使得利用索引的手段更加先进。可以说计算机的出现使索引的使用更加广泛,使索引的作用发挥得更好。
文摘索引型数据库经历了脱机批处理检索、联机检索、光盘检索和网络检索几个阶段的发展。上世纪90年代,INTERNET技术的迅猛发展和普及,计算机信息检索网络化,图书情报界及数据库商开发了基于INTERNET的检索平台,把数据库放在网络服务器上,提供网络版的数据库检索,才使数据库检索大众化。网络使信息挣脱传统物理条件的束缚,大规模快速转移和复制信息成为可能。数据库检索的主体由专业人士到普通民众,成千上万的用户接受了基于INTERNET的网络检索形式,迅速抛弃了光盘检索和国际联机检索和印刷本检索等几种形式。无论是国外引进还是国内购置及自我开发,基于INTERNET的网络版数据库检索已成为文摘索引型数据库的主要检索方式。
3 索引的未来:与网络结合――将揭示更加广阔的资源
在网络发展的今天,索引的形式不断向多样化发展。搜索引擎就是索引在网络上的一个重要应用。主要资源是建立的索引数据库,这是搜索引擎与普通网站的不同之处。它搜索的信息资源以www信息为主,还包括电子邮件地址、新闻论坛文章、FTP及gopher等信息资源。各种搜索引擎在查询范围、检索功能等方面各具特色。www搜索引擎的功能一般分为两类:一是目录式搜索,用户可通过主题目录的指引,逐层浏览,直到找到与自己的需求有关的信息。目前,这种搜索方法已开拓出建立用户模型的技术,允许用户自己在节点之间加上联接链(结构联接),或根据用户的查询路径进行动态推理,并建立起新的联接链(推理联接);二是索引式搜索,它提供对关键词、主题词或自然语言的查询,用户在搜索框中输人检索词或表达式,搜索引擎会返回一组指向相关站点的超链接。这两类搜索引擎由于索引数据库的不同,在检索上各有各的特点。用目录式搜索引擎,可以方便地找到某一大类信息,适用于希望了解某一方面或某一范围内的信息的用户;全文式搜索引擎可以提供真正的全文检索,特别适用于希望得到全面而充分的查询结果的用户。
基于www的搜索引擎只能检索到网络信息资源的一部分。而网络数据库的检索是索引在网络上的又一个重要应用。在国家信息化政策的支持和推动下,我国的数字图书馆建设取得了长足的进步。中国工程技术信息网(CETIN)、中国高等教育文献保障系统(CALIS)、国家科学数字图书馆、国家科技图书文献中心(NSTL)等系统,如雨后春笋迅速成长,互连互通、共建共享,为网络环境下的信息资源建设和信息服务创造了有利条件,为用户利用信息资源提供了便利。
目前我国数字图书馆系统平台都已经建立起来,但是这些平台上面的数据建设还是初创阶段,还有许多的不完善,例如中国高等教育文献保障系统(CALIS)。CALIS在“十五”期间“高等教育数字化图书馆(CADLIS)”项目建设中,除资源建设外,还将构建满足高校用户需求的数字文献服务环境,这是最先启动的重要任务之一,这个服务环境和分布式合作虚拟参考咨询、教学辅助、科研辅助、信息素质网上培训等五大数字化服务环境将共同构成CADLIS的基本框架。在这个平台上,各个高校可以最大限度地资源共享。但是由于各个高校使用不同的OPAC馆藏系统,数据没有统一的接口,还不能够在一个平台上共享各个高校的馆藏文献。如何把更广泛的网上数据库资源整合、共享将是数字图书馆的发展方向。
对于商业数据库来说,各个商业数据库都有其自身的特点,有些优秀的数据库产品在一定程度上解决了某类文献资源查找的“精”、“准”问题,但要又“快”,又“全”地找到需要的文献资源,最核心的问题就是怎样给读者提供一个集成的,或称支持同构和异构系统的整合检索系统,并在此基础上进一步利用开放链接机制链接各种类型的全文“馆藏”,给读者提供“一站式”文献信息服务。将要集成的全文数字资源包括中外文期刊、中外文学位论文、中外文图书、重点学科学术网站、高校特色数据库以及各馆丰富的印刷型资源等。这将是一个“高可用性”的文献服务环境的核心。
4 索引的未来:与数字图书馆结合――达到与一次文献的无缝链接
随着高校图书馆的数字化、自动化、网络化建设步伐加快,图书馆和信息部门引进的网络资源日趋丰富。据CALIS报道,我国已经引进200多种数据库,有20多种检索平台。各个数据库的运行环境和检索界面各不相同,用户在访问数据库时,不仅要掌握各种数据库的使用方法,而且还要反复登录不同的数据库重新检索,不仅对用户的检索要求高,而且检索效率低。如何屏蔽分布的各子系统间差别,提供一致的检索界面和检索技术,由系统自动执行跨系统的检索,在系统间不同的信息格式、检索方式等方面进行转换,然后对检索结果进行整理去重,最后通过表格或图形进行显示,就是统一检索异构检索平台要完成的工作。
20世纪90年代后期,国内外适合分布式异构信息资源的整合和检索系统应运而生。跨平台检索,即用户事先对系统进行一次设定,以后就可以在一个界面同时检索多个数据库,得到所有选定的数据库的检索结果。国外图书馆和IT行业相继开发了10余种异构平台系统。例如:ENCompass with LinkFinder Plus等。我国清华同方公司和长江上海计算机系统工程等公司开发了分布式异构信息资源的整合和检索系统,但对于涵盖分布式、超大规模、具有可操作性的异构平台资源库群,提供无缝链接的信息服务还有待完善。
近年来,全文数据库越来越多,主要包括网络全文数据库和光盘电子期刊全文数据库。我国的全文光盘数据库《中国学术期刊(光盘版)》已正式发行并同时在网络上出版了《中国学术期刊》可提供全文检索。大多数联机检索型电子期刊也提供全文检索。众多全文数据库的出现也给用户增加了新的麻烦。一站式检索平台的出现解决了这一问题。
“一站式”检索主要通过提供索引数据库与全文数据库的文献链接来实现。用户可以通过对文摘型数据库的检索和全文链接,直接获取全文文献。
具有实力的网络索引数据库提供商,建立内部数据库之间的链接,并与外部数据库的有效链接,形成以知识为基础的学术信息资源整合体系。比如EI的检索平台EIVILLAGE2,在检索方式上,提供简易(快速)查找和高级(专家)查找两种检索方式,并设有联合检索字段,便于全面检索相关文献,EVillage2还具有整合数据库的功能,EiVillage2平台上整合了多个数据库,可以跨库交叉检索和联合检索,可跨库检索的期刊有17290种,会议录12000多种,专利2000多万个,前提是用户所在机构已购买这些数据库的使用权,此外,还可联合检索Agri2cola,PubMed等外部数据库,检索结果可自动去重。EI VILLAGE2还提供超链接功能,可提供多种类型的超链接,可以和图书馆购买的外文全文数据库进行全文的超链接,能够直接打开全文,实现一站式检索。
目前国内数据库多向全文数据库发展。近几年来,全文数据库层出不穷,大量增加,但是索引数据库在质量和数量上都没有很大的发展,尤其是象EI、SCI这样在质量和数量上都在具有权威性的大型索引数据库还没有出现。因此,建设我国的大型索引数据库和一站式检索平台,也是索引工作的发展方向。
参考文献
1 徐月英.论索引的作用与编纂策略. 辽宁师范大学学报(社会科学版),2000(2):65-66
2 陈凌,王文清. 数字文献服务环境与CALIS统一检索平台. 上海交通大学学报,2003(9):31-35
3 罗春荣. EiVillage2和WebofKnowledge数据库平台的比较分析. 图书馆论坛,2004(6):83-86
4 葛燕,充学军,梁杆. 网上科技资源的检索和利用.计算机与网络,2005(1):53-56
5 王泽琪. 文摘索引型数据库和全文数据库检索系统的比较. 图书馆工作与研究,2005(3):48-51
方燕虹 女 1963年生,华北电力大学图书馆信息咨询部主任。