近年来网络新型学术信息资源、搜索及搜索工具分析
赵金海
(聊城大学图书馆 山东聊城 252059)
摘 要 从实用的角度,阐述网络新型学术资源的概念、种类和特点,分析、比较网络学术资源挖掘、检索等工具的功能、特点,预测未来网络学术资源、搜索及搜索工具的发展前景。
关键词 学术信息资源 学术搜索引擎 文献检索工具 看不见网
网络通讯、数据库和文献标引与检索等技术的发展成熟,使学术信息资源在互联网上得以迅猛增加。但要想从丰富的文献资源中准确快捷地搜索到所需学术信息,已成为网络时期广大科研工作者们必备的一项基本技能。为此,本文就网络新型学术资源的挖掘、检索工具及发展前景进行探讨,以求同仁们的共鸣。
1 网络学术资源的概念、种类和特点
1.1 网络学术资源的概念
网络学术资源是相对于传统的学术资源而言。传统学术资源通常指利用目录、索引、文摘、字词典、百科全书、年鉴、手册、年谱、年表、图谱等纸质检索工具检索的文献。而网络学术资源的挖掘则侧重于利用搜索引擎或网络数据库专设检索工具检索新型数字文本信息、统计数据信息及多媒体信息等。
1.2 网络学术资源的种类
一般来讲,网络学术资源可根据不同标准进行划分:
(1)如按数字化程度可分:①数字化传统学术资源:目录、索引、文摘、字词典、百科全书、年鉴、手册、年谱、年表、图谱、专利、标准、政府报告等。②纯数字化学术信息资源:论文、图书及统计信息或数据数据库、专业机构网站、网页、博客、论坛、软件和多媒体文件等。
(2)如按搜索引擎搜索到与否可分:①看得见网络学术资源;②看不见网络学术资源。
(3)如按收费标准可分:①收费学术资源;②免费学术资源。
(4)如按授权与否可分:①授权学术资源;②非授权学术资源。
1.3 网络学术资源的特点
网络学术信息资源的特点如下:
(1)必须获得文献使用权。首先要看学术资源获取者是否具有检索学术文献信息的权限。付费的、授权的,还是免费的。否则,你将无法检索所需文献数据库的内容。
(2)必须具备网络文献检索工具。在进行学术文献检索时,必须掌握数字文献检索工具,即网络文献搜索工具和数据库专设检索工具。前者是指基于网络的搜索引擎;后者是指数据库专设检索工具。
(3)必须具备文献浏览工具。数字文献不同于传统纸质文献的检索那样要翻阅大量的图书资料,但检索必须使用专用检索工具,阅读要匹配专用文献浏览器,如Adobe Reader、CAJ浏览器或超星数字图书馆浏览器等。
(4)必须熟悉各种学术信息源。对各种数据库、信息源的布局和获取渠道,尤其自己所需数据库,要充分了解,熟练掌握,准确应用。
(5)必须掌握文本转换、存储、编辑及其应用的相关软件或工具。在日常的文献检索中,要随时注意常用文本转换、存储和编辑工具的选择和使用。否则,就会遇到不应有的麻烦,或造成检索失误。
(6)必须掌握几种语言的翻译工具,消除语言障碍,以便学习国外的先进理论、宝贵经验或掌控行业最新进展。如选择安装谷歌金山词霸、有道英汉词典、灵格斯翻译家等翻译工具。
2 网络学术资源的检索及检索工具
网络学术资源的检索成败与否,主要取决于对网络学术资源的了解;其次是熟悉和选择检索工具。
2.1 看不见网学术搜索资源
看不见网学术搜索资源主要是指利用普通网络搜索引擎搜索不到的学术文献信息,分为两类,一是通过注册登录才能进入浏览的学术网络信息;二是平常所说的专业数据库文献信息,或称之为数字图书馆中的文献信息。
2.1.1 资源种类举例
看不见网学术搜索资源主要由各大信息类公司创建的网站和数据库组成,如:
① the Academic Invisible Web(http://www.invisibleweb.com),可搜集含10,000多个数据库与常被传统检索工具忽略的检索资源,尤其是网上专业数据库。
② http://www.1ii.org拥有图书馆员为公共用户选择和评估的7,000多种网络资源。高级检索功能可限定结果列表中只返回所需的数据库资源,是查找“看不见网页”的最佳检索工具。
③ Librarians' Index to the Internet(www.1ii.org),是一个逾7,000个可检网络资源,并含有最佳资源、目录、数据库和特殊数据等资源的注释式主题目录。
④ AlphaSearch (http://www.calvin.edu/library/sear-reso/intemet/As),专门检索Internet的最好门户网站,收集了有关某学科或主题的所有相关站点,亦包括隐性Web中的信息[1]。
2.1.2 检索方法及检索工具
看不见网学术搜索资源的网站和数据库一般都设有自己的检索工具,支持布尔逻辑检索式和一些特殊句法的基础上,常见的功能包括简单检索和高级检索,有的含有专业性能较高的检索方法和视觉搜索。如清华同方中国学术期刊论文数据库和维普的科技期刊论文数据库。
2.2 看得见学术搜索资源及搜索工具(搜索引擎学术资源挖掘及检索工具)
看得见网学术资源主要是指那些通过网络搜索引擎搜索得到的学术信息资源。综合性搜索引擎功能强大,覆盖面宽,但在学术信息搜索的准确性上远不如纯学术搜索引擎。如Google学术搜索、百度国学搜索。
2.2.1 资源分布和资源种类
一般来讲,看得见学术资源都是免费的网络资源,查询时不必费较大力气,一般分布在政府机构网站、企事业单位主办网站、数字图书馆、信息服务机构等建立的各种网站上,如数字图书馆目录、学科导航、论坛、博客、网络新闻、网络期刊、报纸等网络文献资源,利用搜索引擎就可方便搜索获得或登录相应网站浏览,或用户注册登录后才能检索的文献。
2.2.2 检索方法及检索工具
学术文献资源的检索方法及检索工具根据划分标准的不同而有别,如:
① 综合性搜索引擎。如独立搜索引擎、元搜索引擎、集搜索引擎等。如可获得公正结果途径的元搜索引擎Gada(http://gada.be/);免费搜索160种数据库,200余万条记录的BASE (http://base.ub.uni-bielefeld.de/indexenglish.htm1)。
② 学术性搜索引擎。免费搜索1920年以来发表文献的Google Scholar(http://scholar.google.com);Elsevier Science公司的科学搜索引擎Scirus(http://www.scirus.com);美国密歇根大学的数字图书馆服务产品OA (OpenAccess)搜索引擎OAIster(http://www.oaister.org);提供古典名著、历史资料、人名书名,为传播中华古代文明和国学研究提供方便的百度国学搜索(http://guoxue. baidu.com),以及微软公司Windows Live Academic Search(2008年5月停止服务)。
③ 垂直搜索引擎或专题型文献搜索引擎。针对某特定领域、某特定人群或某特定需求提供有一定价值的行业信息或专题文件服务的搜索引擎。像垂直搜索引擎SSOOOO(http://www.ssoooo.com/);极搜(GSOSO, http://www.gsoso.com/)。有的垂直搜索引擎抓取的数据来源于关注的行业站点,如www.deepdo.com的数据来源于www.51job.com、www.zhaoping.com和 www.chinahr. com等[2]。
④ 网站上数字化的传统检索工具书和网络版检索工具书。如目录、索引、文摘、字词典、百科全书、年鉴、手册、表谱、图录、年表、汇编等。编辑较好的检索工具一般在其编撰单位的主页上,或编辑出版网络版或光盘版。
⑤ 其他学术信息检索工具。如Turbo10(www.turbo10.com);InfoMine (http://infomine.ucr.edu);the SJSU Academic Gateway(www.sjlibrary.org/gateways/ academic);WebData(www.webdata.com);The EducationResources Information Center (www.eric.ed.gov);FindArticles(www.findarticles.com) 等[3]。
2.3 看得见网与看不见网学术文献资源及检索工具比较分析
两种网络学术文献资源在其种类、特点和搜索方法有所不同,具体情况可参见下表[4]:
表1 学术文献资源及检索工具比较表
资源及工具 | 种 类 | 特 点 | 搜索方法 | 实 例 |
看不 见学 术资 源及 检索 工具 | 学术 资源 | 需注册的网站 | 需权限 | 站内检索 | 需注册登陆的网站 |
授权检索的信息公司数据库 | 同上 | 同上 | CNKI、万方数据库 |
授权检索数字图书馆数据库 | 同上 | 同上 | 购买万方、维普数据库 |
搜索 工具 | 站内检索工具 | 站内检索 | 同上 | CNKI库内检索系统 |
一站式、跨库检索工具 | 契约馆馆藏检索 | 同上 | 汇文一站式服务等 |
自建数据库目录及馆藏内容 | 库内检索 | 同上 | 长江、运河文化数据库 |
看得见学术资源及检索工具 | 学术 资源 | 网站网页 | 不受限制的网站网页 | 搜索引擎 | 国学、新浪等网站 |
网址大全链接内容 | 推荐检索网址大全 | 同上 | 114、好网等 |
论坛、博客、学术性应用软件 | 专用搜索工具 | 同上 | Blog、论坛搜索引擎 |
搜索 工具 | 综合性搜索引擎 | 搜索引擎检索 | 同上 | Google、百度等 |
学术搜索引擎 | 学术搜索引擎 | 同上 | Scirus、国学搜索等 |
数字化传统检索工具书 | 数字化的传统检索工具书 | 同上 | 目录、索引、文摘数据库等 |
3 学术文献资源及检索工具展望
近年来学术信息资源及检索工具取得了长足发展,但学术文献资源布局与整合,文献检索与利用的理论与技术方面还存有许多问题和技术难关,需要科学工作者们进一步研讨:
3.1 支持规范与自然语言,方便检索词的选择
未来要求检索工具要适用于规范和自然检索词。因汉语语言词汇丰富,一词多义现象严重,用户又倾向于使用自然语言。目前,虽有一定数量支持自然语言的检索工具,但与用户的要求尚存较大距离,该课题仍是今后一段时间的研究目标。
3.2 加深语义理解,细分专业搜索工具
数字文献的搜索过程中,检索系统是否能根据上下文之间的关系理解检索者所用检索词的真正含义是编制文献检索工具技术难点之一。只有根据根据检索者的真实意图,或上下文之间的语义关系,才能真正确定所见检索词的真正含义,按用户要求检索出所需文献。为此,科研工作者们对此进行了不懈努力,研制出许多像垂直搜索引擎类的检索工具,该系列检索工具就是未来搜索工具的发展方向,帮助用户更有力、更准确地检索出自己所需的文献信息。
3.3 求全检索,不断扩大跨库检索平台
一般来讲,目前已经具有了在一个站点或数据库界面跨库检索的检索工具,但其检索面还太窄,数量还太少。最理想的检索工具是登录一个站点就能检索所需的所有文献。事实上,目前情况下根本无法实现。不过,Google、百度、CNKI等检索工具对此做出努力,能检索到相当数量的数字文献。然而,有些只是数字文献源的链接,真正索取原始文献还需购买权限,或付费下载阅览。不过,这给我们指明了发展方向[5]。
3.4 精编目录、文摘,提供原始文献出处与线索
用户能否按意愿索取数字文献的目录、文摘和原始文献,这要根据检索工具提供的数据结构来定,一般较理想的检索工具首先应能够指引原始文献的出处,即目录或索引揭示的原始文献;如进一步了解则须了解文摘或内容简介;读者阅读后再决定是否索取原文。因此,好的检索工具必须提供这三项内容,但能否提供免费链接、馆藏地点或购买地等信息,也是衡量检索工具编撰成功与否的标准之一。
3.5 增设引文检索功能,利用文中注释和参考链接充实文献内容
利用学术搜索引擎可了解数字文献被其他文献的引用情况,搜索引擎收录范围的大小决定了统计引文结果的准确性。近几年,数字学术文献中,尤其网页上的学术文献中增添了大量注释、参考文献、超级链接,或推荐文献,为一些对文献背景了解不深或不全面,并想进一步了解的读者提供了极大方便。
3.6 按需订制检索工具,方便学术信息资源挖掘
目前,科研工作者们对数字文献运用的依赖性逐年逐日增长,繁琐登录数据库或网站界面给科研工作者带来极大的烦恼。于是,登录网站界面用户个性化的订制和站内、库内文献信息更新的订制都已成为科研工作者所具备的基本功。通过网站用户界面订制、文献信息内容订制,或网站,或电子邮件等工具,读者可在第一时间里了解最新信息。如IGOOGLE,中国搜索等;数据库像Elsevier、CNKI等。
3.7 拓建专题学术数据库,增设普及性搜索引擎检索功能
目前,Google的学术搜索和百度的学术搜索等普及性搜索引擎就是这方面的典范。在专题性学术数据库信息输入普及型搜索引擎数据库方面,首先向用户提供目录和文摘,然后提供获取线索、方法和链接。一般来讲,提供的原始文献多数是刊载在网站或网页上的公共性文献,较少涉及到版权问题。相对于专业数据库而言,此类检索工具不必付费或授权就可查找,得来的多数文献权威性欠佳;或虽质量较佳,但过于大众化,即已成人们共知文献。未来,如何使检索工具更具共用性,即不仅把人们共知的权威学术文献检索到,还要检索到特殊的、专业的文献,恐怕这才是人们最期待的检索工具。
4 结语
综上所述,学术信息资源的搜索,首先在于对所藏所需学术信息资源的了解,知其所在;其次,掌握各类文献资源相对应的检索工具,如哪些优于检索目录,哪些优于检索索引,哪些优于检索文摘,又有哪些优于检索全文或各种统计信息或数据。普通专题文献检索可利用一般免费信息资源;要求专且深的专题文献检索则要检索收费的专业数据库。要想尽快尽准地检索所需各种数字学术文献信息,我们必需充分了解各种数字信息资源及其相应的检索工具,并作出正确的评价和选择。
参考文献
1 Dirk Lewandowski,Philipp Mayr.Exploringthe academic invisible web.Library Hi Tech,2006,24(4):529-539
2 Goldwing. 垂直搜索引擎.[2008-10-08].http://blog.sina.com.cn/s/reader_55719882010002ky.html
3 Marcus P.Zillman. Academic and Scholar search engines andsource: an internet mini guide annotated link compilation.[2008-08-06] http://www.whitePapers.us/
4 常唯. 综合性学术搜索引擎研究. 大学图书馆学报,2007,(2):117-119
5 毛力. 学术数据库与普及型搜索引擎的合作研究. 现代图书情报技术,2006,(9):12-17
赵金海 男,1956年生。山东聊城人,聊城大学图书馆副研究馆员。出版专著2部,发表论文40余篇。