“高校古文献资源库”检索功能综述 姚伯岳
发布时间:2018-09-25  浏览次数:14

“高校古文献资源库”检索功能综述

姚伯岳

(北京大学图书馆  100871

    “高校古文献资源库”是我国第一个高校校际古文献数据库。该数据库的检索功能独特而完备,善于利用这些检索功能,能极大地提高相关学术研究的效率,使读者受益无穷。

关键词  高校古文献资源库  学苑  数字图书馆  古文献  数据库  元数据  检索

 

1“高校古文献资源库”的创建和发展

“高校古文献资源库”是由北京大学牵头,与南京大学、北京师范大学、四川大学等高校图书馆共同建设的我国第一个高等院校校际古文献数据库[1]。作为CALIS“十五”建设规划“专题特色数据库”的一级资助项目,其建设宗旨和任务是:推动我国高等院校图书馆藏古文献的数字化进程,实现高校古文献数字资源的共建共享,并相应建立起一套较完善的古文献数字资源建设和服务体系。

“高校古文献资源库”突破了以往联合目录仅有书目记录而无全文和图像的局限,不仅提供各成员馆的馆藏目录,而且还在元数据中给出全文及图像的链接,采用了元数据、书影图像、电子图书多种形式并重的建库方式。

该项目从20046月开始实施,到2006920项目验收,在制订统一的古籍元数据规范和数字加工标准的基础上,设计完成了“高校古文献资源库”的著录系统和发布检索系统;利用该著录系统,在不到2年的时间,各成员馆就基本完成了本馆所藏古籍的计算机回溯编目,用最快的速度将本馆的古籍检索由卡片目录或书本式目录检索形式转变成为计算机书目检索形式;此外各馆还扫描了大量书影和古籍全文图像,挂接到系统上,形成了一个规模庞大的古文献数据库。项目验收通过之后,各成员馆继续努力,使系统愈完善,数据量持续增加。截止到2008930,“高校古文献资源库”中古籍元数据总量已达22,8023条,挂接书影3万多幅,电子图书2.6万册。

准确地说,“高校古文献资源库”其实是一个动态的网络数字图书馆。与一般的静态数据库不同,各个成员馆都将其作为本馆的古籍数字化平台,不断更新并增加其书目记录和电子资源。这就使“高校古文献资源库”具备了无穷的生命力。随着二期建设的开始进行,其成员馆将不断增多,文献类型也会相应增加,系统功能将更加强大和完善,元数据数量和电子资源日益丰富,“高校古文献资源库”必将发展成为我国高校最重要的数字图书馆之一。

作为我国高校第一个校际古文献数字图书馆,“高校古文献资源库”具有许多鲜明的特色。其中最为突出的,就是它在古籍元数据检索方面的强大功能。

具体来讲,“高校古文献资源库”是由四个部分组成的:

●�高校古文献资源库古籍著录系统;

●�高校古文献资源库古籍著录系统管理端;

  高校古文献资源库发布检索系统,即“学苑汲古”;

  学苑汲古管理端

其中,高校古文献资源库古籍著录系统是为各成员馆的编目人员提供的工作平台,可以利用该系统进行古籍的编目和书影及电子图书的图像挂接。1  高校古文献资源库古籍著录系统登录界面

发布检索系统即“学苑古”,担负着向读者提供网络环境下的古籍元数据和全文图像的计算机检索与浏览服务的功能。2  “学苑古”登录界面

以上两个系统服务对象不同,其检索界面与检索功能也有一定差异。下面就重点介绍这两个系统在元数据检索方面的情况。

2“高校古文献资源库著录系统”的检索特色

3  “高校古文献资源库著录系统”检索界面

“高校古文献资源库著录系统”是为古籍编目人员设计的一个内部工作平台,其检索界面只有一个,没有简单检索界面和复杂检索界面之分。但是为了编目员工作方便起见,我们将几乎全部著录项目都设为检索途径,这些检索途径分别是:题名,责任者,主题词,典藏号,全面检索,出版地,出版年代,出版者,版本类别,责任者时代,责任者国别,语种,装订方式,文物级别,共14个检索途径。

所有这些检索途径均可进行单独的检索,同时也可进行两个或多个检索途径的组配检索。需要规范著录的事项如版本类别、责任者时代、语种、装订方式、文物级别等还分别采用下拉菜单的方式,便利编目员的检索和统计。

此外,还有数据级别、资源类型、排序方式三项限制性检索。

数据级别分为已校对和未校对2种,编目员级别提交的记录为已校对记录,录入员级别提交的记录为未校对记录。

资源类型分为古籍和舆图两种。我们虽然为舆图设计了单独的元数据规范及著录规则,但由于舆图相对古籍来说数量太少,而且古籍的著录事项基本能够涵容舆图的内容,所以就没有设计单独的舆图编目系统。不过编目员编目时可以在资源类型项选择舆图,也可以在检索界面选择资源类型中的舆图进行有关的检索。

检索结果的排序方式默认为按正题名的汉语拼音顺序显示,也可以选择按典藏号顺序显示检索结果。按正题名的汉语拼音顺序显示检索结果,如果题名相同,则按照出版年代的公元纪年顺序排列简单记录结果。

按典藏号顺序显示检索结果,就是按分类号和书次号顺序排列简单记录结果。这样做有利于编目员对编目记录的查重和给号。按典藏号的顺序排列,其规则是:先按拉丁字母顺序排列,再按阿拉伯数字顺序排列。这样,相同的字母前缀可以排在一起,于是就将善本、特藏和普通古籍区分了开来;而在每一类型的文献中,又基本与其在书库中的典藏序列相吻合,便利了编目员的查重工作。

题名的检索点不仅包括题名项,而且还包括附注项中的丛编、子目、附录等事项。这样,就扩大了题名的检索范围,提高了查全率。

为了配合近年来启动的全国古籍普查保护工作,我们还根据新出台的国家标准《古籍定级标准》(WH/T 20-2006),设置了文物级别的著录事项和检索途径,并分别设计了10个级别的下拉菜单,以便于按照各级别进行著录和检索。

“高校古文献资源库著录系统”检索界面的“全面检索”一项,也是凸显其强大检索功能的一大特色。过去所谓的全面检索,是指对简单检索中几个有限的检索途径如书名、作者、主题词等进行的一种通检。在“高校古文献资源库著录系统”中,全面检索的含义发展为对所有元数据全文内容所进行的检索,变成了事实上的全文检索。不过为了避免与古籍原书内容的全文检索相混淆,仍沿用了“全面检索”的说法。

由于系统精确显示检索结果的数量,所以检索同时也具有了统计的功能。

此外,还设计了按编目员用户、账号结合年、月、日检索的功能,以便编目员统计自己的工作,同时也方便校对员对某一编目员编目记录的集中校对。

3“学苑古”的检索特色

“学苑古”是高校古文献资源库的发布和检索平台,它的服务对象是高校师生及社会上的广大读者。如何更加方便读者对古文献的检索,是设计该系统的主要出发点。

该系统用户分为普通用户、阅览室用户、高级用户、图书馆员用户四级:

普通用户是社会上的广大读者,可以查看古籍书目记录的简要和详细显示结果,以及古籍书影图像的缩略图。

阅览室用户是亲身到馆操作的读者,可以查看书目记录的详细显示结果和中精度图像,可执行“收藏”功能的操作,并下载一定数量的书目数据。

高级用户是收费用户,凭专用的账号和密码,可以查看书目记录的详细显示结果和高精度图像,并执行打印、下载等所有功能的操作,但将根据付费情况进行时间和数量的限制。

图书馆员用户是相关图书馆的专门人员,可以执行系统设置的所有功能,以帮助读者满足其各方面的需求。

 “学苑古”系统提供检索、浏览、索引等多种方式供读者查询高校古文献资源库中的数据。下面分别介绍:

4  “学苑古”的简单检索界面

31  检索

“学苑古”设计了简单检索和高级检索两个界面。在主页点击“登录”,即进入简单检索界面;如要进行高级检索,点选“高级检索”,页面下方即转换为多选库的高级检索模式。

简单检索设置了题名、责任者、主题词、典藏号、出版地、出版者、全面检索等7个检索途径。

检索方式有前方一致、包含、精确匹配,系统默认“包含”。4  “学苑古”的简单检索界面

高级检索有多个选择检索点的下拉菜单、多个检索形式的下拉菜单和多个文本输入框,可以分别输入多个检索词实现多个检索字段的组配检索,也可只输入一个检索词进行检索。

高级检索的检索途径为:题名、责任者、主题词、典藏号、出版者、出版地、出版年代、版本类别、装订方式、语种、责任者时代、责任者国别等,共12个检索途径。5  “学苑古”的高级检索界面

在一般的检索系统中,限定条件不能单独进行检索。但为了提高“学苑古”的使用价值和学术价值,本系统对限定条件也设计为可进行单独检索。

比如:在“责任者时代”栏输入检索词“清”字,就可以检出数据库中全部的清代作者的著作;在“责任者国别”栏输入检索词“日”字,就可以检出数据库中全部的日本作者的著作;在“装订”栏点选下拉菜单中的“蝴蝶装”字,就可以检出数据库中全部的蝴蝶装古籍。

在简单检索和高级检索界面的下方,有“选择检索范围”一栏,排列有全部5个成员馆。系统默认为全选,也可进行某个馆或某几个馆的勾选。所以,学苑古既是一个多馆古文献联合检索系统,也可以用来作为某单个馆的古文献检索系统。对于那些尚未开发设计本馆古文献数据库的图书馆,高校古文献资源库无疑是一个最佳的替代品。

检索界面的最下方有返回检索结果的数量限制,即:“每次查询最多返回”,其后紧跟的下拉菜单有预置的数量,分别是1002005001000。也就是说,读者一次检索最多可以得到1000条古籍记录的简单和详细信息。这样做的目的,是为了防止对古籍元数据的恶意下载,是对知识产权的一种保护行为。

对文献进行检索后,进入古籍简要结果显示页面。分页显示所有检中记录的信息,每条记录包括题名、主要责任者、出版信息、版本类别、典藏号和图标。其中,题名和图标为超链接。点击题名,可查看该记录的详细信息。点击图标,可查看该记录的相关图像。

执行一次检索之后,在简要结果显示界面下方有一个检索条件输入框,允许在检中结果中进行二次检索,其检索点除缺少责任者时代、责任者国别2项之外,其他各项与高级检索相同。

所有检索途径均可使用繁体或简体字检索,检索结果基本不受影响。“题名”、“责任者”、“主题词”三种检索途径还支持汉语拼音的检索,字母大小写均可。6  “学苑古”的简单结果显示界面和详细结果显示界面

3.2 浏览

为了弥补单纯检索全局性展示功能不足的弱点,学苑汲古还专门设置了浏览界面。浏览的显示结果包括所有成员馆的馆藏记录,不再予以区分限制。检索结果的显示按题名的汉语拼音顺序排列。

点击界面上方工具栏中的“浏览”,就进入了古文献的界面。目前暂时只有古籍的浏览项目,分别设有版本类别、出版年代、出版地点三项。点击浏览节点前的“+”号,其下位类目展开;直接点击浏览类目,可以浏览该类目所有相关书目数据的简要显示结果,并可进一步查看详细显示结果。

比如点击浏览节点“刻本”下的“套印”图标,右侧立刻显示出数据库中所有的套印本记录,其上方并有提示:“根�版本��套印共查�到 583 ���共返回�� 583 �第1/59�”

如果点击浏览节点“活字本”,则立刻返回3724条活字本的记录。

由于浏览结果的显示没有返回数量的限制,所以用“浏览”方式查阅书目记录,无异于在翻看种种专题古籍书目。如果再能充分利用下方的二次检索,得到的检索结果就更具学术价值了。7  “学苑古”的浏览界面

3.3 索引

同一种书可能有各种不同版本,同一作者可能有多种不同著作。为了集中显示同一题名或同一责任者的所有记录,学苑汲古还设置了“索引”功能。

点击页面上方功能栏中的“索引”,即进入索引界面。索引提供题名和责任者两个途径,可以抽取索引,并显示相关记录。系统默认古籍的题名索引。题名索引和责任者索引界面都有汉语拼音字母的检索点排列,以便按题名或责任者首字的汉语拼音字头进行索引结果的排列。这种按一定顺序排列相关题名或相关责任者的功能,也是研究者时常需要用到的。

索引结果为超链接。点击索引结果,即可显示所有相关书目记录的简单结果。

8  “学苑古”的题名索引界面9  “学苑古”中责任者索引界面

3.4 检索结果的收藏及下载

为了便于读者将选中的古籍元数据内容暂时保存在系统中,以便集中地提取或打印,学苑汲古还设计了检索结果的收藏功能。但此功能只有阅览室用户以上级别才能使用,普通用户无权使用此功能。

检索结果的收藏方法是:选择检中记录前面的多选框,然后点击“收藏”按钮,系统自动将选中的记录放到“我的收藏”中;如果想要收藏当前页全部检中记录,则点击页面下方的“全选”,然后点击“收藏”按钮,系统则自动将当前页全部检中记录放到“我的收藏”中。打开“我的收藏”,选择文献类型,可浏览已收藏的全部书目记录。此时如欲保存所收藏的记录,则先选择下载文件的格式,然后点击“下载”,即可下载保存被选中的记录。下载格式有文本格式和html格式两种,默认下载简单记录,也可以选择下载详细记录。10  “学苑古”的记录收藏点选界面

4“高校古文献资源库”强大检索功能的意义和价值

“高校古文献资源库”的问世,是中国图书馆古籍界的一件大事,它标志着中国高校古文献数字图书馆已初具雏形,其在古籍检索方面的意义也不容小觑:

1“高校古文献资源库”实现了国内收藏中国古籍最为丰富的4所高校图书馆馆藏古籍书目数据的集中检索,方便了读者对这些图书馆所藏古籍的阅览使用。

2“高校古文献资源库”是一个广域网在线数字图书馆,可供全球用户随时随地查询使用,从而极大地开拓了高校图书馆藏古文献的使用范围。

3“高校古文献资源库”不仅仅是一个古文献书目信息存储和检索系统,而且还是一个颇具规模的数字图书馆。除馆藏书目数据外,读者还可以在这个数据库中直接浏览古文献的书影图像或全文图像,今后还可以查看和检索文本式的古文献全文。

4“高校古文献资源库”提供了10多个检索途径的单独检索,同时还允许各种高级组配检索,甚至还提供元数据的全文检索,极大提高了数据库的使用价值和检索结果的学术价值,成为学者们的得力助手。

5“高校古文献资源库”的检索系统“学苑古”所具有的“浏览”功能,使得古文献的检索方式更加直观、便捷,检索结果更加系统、完整,具有极高的使用价值。

6“高校古文献资源库”返回检索结果的数量统计功能,是以往的卡片目录和书本式目录所不具备的,为学术研究的进行提供了有利的条件。

总之,为了方便广大用户和读者的使用,最大限度地发挥数据库的使用效能,充分体现数据库的学术价值,“高校古文献资源库”的著录系统和发布检索系统在检索功能的设计上,是非常用心和独具特色的。相关的用户和读者如果能熟练掌握这些多种多样的检索功能,并能切实使用,一定会感觉到莫大的便利,对其学术研究的顺利进行将裨益无穷。

 

注释

1  2008年初,在北京大学图书馆的协助下,香港中文大学图书馆也开始向“高校古文献资源库”提供其馆藏古籍书目记录,从而成为该数据库的第五个成员馆。

 

姚伯岳  男,研究馆员,北京大学图书馆古籍部副主任。