DIALINDEX数据库收录内容及检索方法
郭丽芳
(复旦大学图书馆 上海 200433)
摘 要 在简要介绍DIALINDEX数据库作为Dialog系统总索引文档的基础上,本文阐述了其在命令驱动方式下和在菜单驱动方式下的两种检索方法,最后得出两点启示。
关键词 DIALINDEX 411文档 检索方法
Dialog是当前世界上最大的国际联机检索系统。在利用Dialog系统进行联机检索时,在与用户课题无关的数据库中执行正确的检索策略,或在与用户课题相关的数据库中执行不正确的检索策略,都最容易造成联机用户不必要的时间和金钱浪费。Dialog联机检索系统中的总索引文档DIALINDEX,编号为411,就是Dialog系统帮助用户根据课题选择最相关的数据库和最精确的检索策略的重要工具之一。下面就简要介绍Dialog联机检索系统中的总索引文档DIALINDEX及其在两种驱动方式下的两种检索方法。
1 Dialog系统及DIALINDEX总索引文档
1.1 Dialog联机检索系统
Dialog联机检索系统始建于60年代,1972年开始提供联机检索服务,2000年被Thomson公司并购从而成为Thomson集团的新成员。作为世界上历史最悠久和规模最大的联机检索系统,Dialog系统目前包含600多个联机数据库,收录数据库范围来源于世界各国。收录的文献类型有:书报、期刊论文、学位论文、会议录,研究报告、世界专利、工业标准,政府报告、市场行情、技术报告、银行投资研究报告、公司厂商名录、经济预测、统计数据、新产品通告、广告、商标等。收录的数据库类型有:书目数据库,主要存放原始文献的书目信息;指南数据库,主要存放一些公司、团体介绍,或化学物质的名称、结构和登记号等指南性信息;数值数据库,存放调查数据或统计数据等;全文数据库,存放专著、期刊、报纸、工具书以及其他文献的全文。收录的数据库主题范围有:自然科学(如天文学,数学,物理,化学,生物,能源等),应用科学和工艺(如食品与农业,药学与制药,化学与化工等),社会科学(如商业与财政,政府与法规,知识产权,新闻与媒体等),人文科学和时事报道等,专业范围扩大到几乎所有领域。而且,Dialog系统的数据库都是从世界上著名的数据库生产商那里租借或购买,质量有保障。Dialog系统的数据库更新频繁,记录数每年都在增加。
Dialog系统联机检索功能强大,使用户能够享受到一站式服务,为各种信息需求提供了高效精确且一步到位的一次性解决方案。不必象检索因特网上信息时一个个站点地转来转去,也不必为了提高查全率而使用不同情报单位的不同检索工具。Dialog所有数据库可以并行多库检索,也可以分层专类检索。Dialog系统数据库中所有有检索意义的字段被标引为两种索引:基本索引(Basic Index)和附加索引(Additional Index)。基本索引包含与主题相关的字段,如题名(/TI)、文摘(/AB)和叙词(/DE)等字段,附加索引则包含其他可检字段,如作者(AU=)、文献出处(SO=)和出版年代(PY=)等字段。在实际检索过程中,如果用基本索引,则可以不加限定;如果想查询指定的基本索引字段内容,则用字段后缀代码加以限定;如果用附加索引,则必须用字段前缀代码加以限定。
1.2 DIALINDEX总索引文档
在Dialog联机检索过程中,用户往往需要先了解自己检索课题的最相关检索策略即检索式,以及在各个数据库的命中记录数,这时就需要用到Dialog系统的总索引文档——DIALINDEX文档。DIALINDEX文档是Dialog系统的总索引,文档编号为411。它是一个具有特殊功能的文档,并不存贮具体的文献记录内容,而是存贮Dialog系统全部的基本索引和附加索引。它的作用是:根据用户的提问式对全系统所有数据库的基本索引和附加索引进行一次扫描,然后在屏幕上显示出检索结果。在检索结果中,所有与提问相关的数据库及检索命中的文献数目都可以显示出来,但不能直接输出命中文献(如果需要输出命中文献则必须进入具体收录数据库进行检索)。由于411文档的机时费相对较低,因此用户在对课题不明显符合某一个或某一组数据库、对检索式的检索结果心中无数的情况下,一般先调用411文档进行一次入库检索前的摸底检索,验证其所选择的待检数据库是否恰当、检索标识与检索式是否正确。这一文档的推出深受用户欢迎,成为使用频率最高的文档。
但是随着国际互联网络的发展,特别是网上免费信息不断扩充,同时又出现了Yahoo等搜索引擎,这些影响着Dialog系统的用户纷纷使用更加便宜的方式查找信息。面临着激烈的市场竞争以及因特网免费提供信息带来的挑战,Dialog系统不断地采取措施,如增加新的数据库,调整收费结构,改善检索软件功能和用户检索界面等来降低通讯费。甚至于还利用因特网提供web服务,并为不同的用户群提供不同的网站界面,如针对专业检索人员的网站http://www.Dialog-Classic.com,用户可以通过浏览器用命令方式直接检索;如针对专业检索人员和普通用户的网站http://www.Dialogweb.com,它提供了命令驱动和菜单驱动两种检索方式;还有针对用户对产业信息需求的网站http://www.DialogSelect.com。这些改进措施使得Dialog系统的服务方式更完善,更具竞争力。其中,http://www.Dialogweb.com用户最广泛,因为它提供了针对专业检索人员的命令驱动和针对普通用户的菜单驱动两种检索方式。下面将具体介绍登录http://www.Dialogweb.com网站界面后411文档的两种检索方法。
2 DIALINDEX在命令驱动方式下的检索方法
登录http://www.Dialogweb.com界面后,输入用户名和密码进入检索页面,在检索页面最下面的命令输入框中输入检索命令,就进入了命令驱动方式下的Dialog系统检索。
2.1 命令驱动方式下的检索方法
在命令驱动方式下,DIALINDEX的检索方法如下:
(1)BEGIN 411,可以简写成B 411,打开DIALINDEX总索引文档。系统将显示411文档的介绍。
(2)SET FILES,可以简写成SF,后面输入想要浏览的数据库,最少2个数据库。可同时选择所有适用于DIALINDEX的数据库(例如:SF ALL),也可输入多个数据库号的组合或数据库类目缩写(例如:SF BIOTECH,PATENTS或SET FILES 2,34或SET FILES BIOTECH,34),以便用户自由地选择创建自己要浏览的文档群组。
(3)SELECT,可以简写成S,后面输入检索词或检索式。因为不产生检索步骤,所以完整的检索策略必须在一个SELECT命令中输入。在这步中可以使用最重要的检索词,但不必包括所有的同义词。为确保逻辑的正确性,在必要时适当地使用括号。如果要把检索词用OR连接,必须用圆括号把它们括起来。
(4)EXPAND,可以简写成E,后面输入需要查询的检索词。这个词表查询指令用来检索并显示数据库中准确的、相关的多个检索词,供用户构造检索式或检索策略之用。
(5)SAVE TEMP,用来保存用户检索策略,以便在后面输入EXS命令时执行检索。
(6)RANK FILES,用来根据包含命中记录数的多少对包含相关记录的数据库进行排序,包含命中记录数越多的数据库越排在前面,同时依次给数据库一个排序号N,以确定与用户课题最相关的数据库,最多可将50000个条目排序。
(7)BEGIN HITS/N,BEGIN HITS命令表示检索包含命中记录的所有相关数据库,BEGIN N(N是由RANK FILES命令产生的数据库排序号)表示只检索包含命中记录较多的相关数据库。
(8)EXS,表示在进入相关数据库后执行保存的检索策略并显示检索结果记录。
在上述检索过程中需要注意的是,当用户开始检索411文档时,可选择一组2个以上的数据库供搜索浏览;可输入唯一的select命令来找出每个数据库有多少记录包含用户的检索词或检索式;但是在411文档中检索时,用户不能浏览显示记录,不能输入多个select命令,不能把检索步骤号进行逻辑组配(在411文档中不能形成检索步骤),不能在EXPAND(查词指令)显示时输入select命令。
2.2 命令驱动方式下的数据库分类
在Dialog系统中,进行DIALINDEX检索或OneSearch检索时,所有数据库按主题分属不同的类目,每个类目有一个只取首字母的缩写名称,用于在检索过程中表示一个文档群组。例如,属于主题类目“Market Research”下的所有文档群组在检索时用缩写名称“MKTRES”表示。数据库有两种类型的类目:Supercategories和Categories。
Supercategories包含数量非常大的与主题相关的文档,是Categories的群组,只能用于DIALINDEX检索。例如:Supercategories类目缩写ALLSCIENCE组共有150多个包含科学主题的数据库。411文档包含的Supercategories类目如下表1所示。
表1 Supercategories类目首字母缩写名称及全称
Supercategories类目 | Supercategories类目 | Supercategories类目 |
ALLSCIENCE (Science) | ALLSOCHU (Social Sciences and Humanities) | ALLBUSINESS (Business) |
ALLBIOSCI (Biosciences) | ALLSOC (Social Sciences) | ALLPRODUCTS (Products) |
ALLCHEM (Chemistry) | ALLHUMAN (Humanities) | ALLTMKS (Trademarks) |
ALLCHEMH (Chemical Handbooks and Encyclopedias) | ALLIP (Intellectual Property) | ALLINDMK (Industries and Markets) |
ALLMATER (Materials) | ALLGOVER (Government) | ALLPAT (Patents) |
ALLMEDPH (Medicine and Pharmaceuticals) | ALLPAPER (Newspapers Fulltext) | ALLCOFIN (Company Financials and Reports) |
ALLENG (Engineering) | ALLNEWS (News) | ALLCOMMON (Common Law Marks) |
ALLENERGY (Energy) | ALLONTAP (ONTAP Files) | ALLPATFU (Patents-Fulltext) |
ALLPHYS (Physics, Astronomy, and Mathematics Research) | ALLREFERENCE (Reference) | ALLCODIR (Company Directories) |
ALLENVIR (Environment) | | |
Categories包含少的、更特殊的10到15个数据库,在DIALINDEX检索和OneSearch检索时都可以使用。例如:ARCHITEC代表建筑学的文档,BIOTECH代表生物工程,NUTRIT代表与营养及食品相关的数据库。Categories类目在411文档的蓝页(http://library.dialog.com/bluesheets/html/bl0411.html)上有列出,由于太多这里就不详述了。
2.3 命令驱动方式下的检索实例
在命令驱动方式下,在检索页面的命令输入框中依次输入检索命令,具体过程如下:
(1)B 411
Database : 411 - DIALINDEX(R) - Copyright : (c) 2007 Dialog. All rights reserved.
(2)SF ALLMATER
You have selected 45 files.
(3)S Fire and (Negative()Temperature()Coefficient or Thermal()Sensitive or Temperature()sensitive or organic()inorganic()composite) and cable
File Database Name Hits
2: Inspec (1898-present) 3
6: NTIS - National Technical Information Service 2
8: Ei Compendex® 2
31: World Surface Coatings Abstracts(TM) 1
118: ICONDA - International Construction Database 1
323: RAPRA: Rubber and Plastics 2
324: German Patents Fulltext 44
340: CLAIMS®/U.S. Patents 13
348: European Patents Fulltext 24
349: WIPO/PCT Patents Fulltext 67
351: Derwent World Patents Index® 15
652: U.S. Patents Fulltext (1971-1975) 26
654: U.S. Patents Fulltext (1976-present) 343
(4)SAVE TEMP
Temp SearchSave TF415849779 stored
(5)RANK FILES
Ref Items File
--- ----- ----
N1 343 654: US PAT.FULL._1976-2007/MAY 03
N2 67 349: PCT FULLTEXT_1979-2007/UB=20070503UT=20070426
N3 44 324: German Patents Fulltext_1967-200717
N4 26 652: US Patents Fulltext_1971-1975
N5 24 348: EUROPEAN PATENTS_1978-2007/ 200716
N6 15 351: Derwent WPI_1963-2007/UD=200729
N7 13 340: CLAIMS(R)/US Patent_1950-07/May 03
N8 3 2: INSPEC_1898-2007/Apr W5
N9 2 6: NTIS_1964-2007/May W1
N10 2 8: Ei Compendex(R)_1884-2007/Apr W5
… … …
如果用户需要检索包含命中记录的所有相关数据库,然后可以输入B HITS命令,再执行EXS对保存的检索策略进行检索;如果用户只需检索包含命中记录较多的几个数据库,那么可以输入B N1-N9命令,同样再执行EXS检索命令。
3 DIALINDEX在菜单驱动方式下的检索方法
登录http://www.Dialogweb.com界面后,输入用户名和密码进入检索页面,选择检索页面上方的“Databases”超链接就进入到菜单驱动方式下的DIALINDEX检索页面。
3.1 菜单驱动方式下的检索方法
在菜单驱动方式下,DIALINDEX的检索方法如下:
(1)依据菜单提示和数据库分类类目,逐级选择与用户主题最相关的数据库群组。选择浏览的数据库可以是Supercategories或Categories类目下的整个文档群组,也可以是某个类目下的一个或多个数据库。
(2)在检索框中输入检索词或检索式进行检索,并显示检索结果记录。如上所述,因为SELECT(可以简写成S)命令不产生检索步骤,所以完整的逻辑检索式必须在一个SELECT命令行中输入。每条检索式字符数不得超过240个。
3.2 菜单驱动方式下的数据库分类
在菜单驱动方式下的检索页面,菜单提示DIALINDEX中的数据库分属到八个大类目下面。这八个大类目分别是“Business”、“Government”、“Intellectual Property”、“Medicine and Pharmaceuticals”、“News”、“Reference”、“Science and Technology”和“Social Sciences and Humanities”。每个大类目下面又分有若干个小类目,每个小类目下面包含有若干个数据库文档。例如,大类目“Science and Technology”下的小类目见图1,小类目“Materials Research”下的数据库文档,见图2。
3.3 菜单驱动方式下的检索实例
在菜单驱动方式下,依据菜单提示逐级选择最相关的数据库群组,然后在检索页面的命令输入框中输入Select检索命令进行检索,具体过程如图2,图3所示。
图1 “Science and Technology”下的小类目
图2 选择“Materials Research”下的数据库群组并输入Select检索命令
图3 显示检索结果
4 DIALINDEX数据库的启示
DIALINDEX数据库收录Dialog系统所有索引的宏大规模,以及最高的系统使用频率等,都说明DIALINDEX作为Dialog系统总索引的必要性。DIALINDEX数据库在Dialog联机检索系统中的这种重要作用,至少能给我们以下两点启示:一是DIALINDEX是一个关于Dialog系统收录的网上文献数据库的总索引,是网络信息资源出现以来最重要的索引检索工具之一,是近年来索引选题的重大创新;二是DIALINDEX所代表的一系列网上文献数据库的发展规模和检索功能,在当今网络信息时代甚至变得不可替代,致使在传统索引、网上文献数据库和网络信息检索工具三分天下的今天,网上文献数据库占主导地位的新格局已初现端倪。
参考文献
1 http://www.Dialog.com
2 http://library.dialog.com/bluesheets/html/bl0411.html
3 http://www.Dialogweb.com
4 郑菲﹒DIALOGWEB中的DIALINDEX﹒现代图书情报技术(1999年增刊):126-127,141
5 张琪玉﹒中国索引事业:当前格局与问题.图书馆杂志﹒2006(1):3-5,13
郭丽芳 女,复旦大学图书馆馆员。