基于TRS的古籍数据库建设 王丽华
发布时间:2018-09-25  浏览次数:22

基于TRS的古籍数据库建设

(吉林大学图书馆  长春 130012)

        本文论述了TRS信息检索发布系统的构成以及功能特点,结合实际工作,探讨了以TRS信息检索发布系统为平台的古籍数据库建设问题,并指出了古籍数字化工作中存在的问题和不足。

关键词  TRS  古籍  数字化  数据库建设


    浩如烟海的古籍,记录了中国古代政治、经济、科技、文化、军事、艺术、宗教、地理、风俗等各项领域的第一手资料。古籍作为中华民族历史与文化的象征,是人类精神财富与智力资源的宝库,这些无可替代的文献资料对人类社会的过去、现在、将来都具有特殊的意义。目前我国的各类型图书馆正经历着前所未有的发展变化,正朝着自动化、电子化、网络化的方向迈进。数字图书馆建设已经成为21世纪我国图书馆发展的基本潮流。古籍数字化是数字图书馆建设的重要组成部分。所谓古籍数字化,就是采用计算机技术,对古籍文献进行加工、处理,制成古籍文献书目数据库和古籍全文数据库,用以揭示古籍文献中所蕴涵的极其丰富的信息资源,为古籍的广泛利用和深度开发提供便利条件。从上个世纪八、九十年代开始,国内一些大型图书馆如:国家图书馆、北京大学图书馆、复旦大学图书馆、南京大学图书馆、辽宁图书馆、南京图书馆、浙江图书馆等,先后进行了古籍书目数据库建设的探索和尝试,并相继建立了规模不等的古籍数据库,为读者检索古籍信息提供极大方便。

由于种种原因,吉林大学图书馆在古籍数字化方面起步较晚,一直未能摆脱传统的手工服务方式。随着计算机技术的发展、社会各界对传统文化的重视以及数字图书馆的飞速发展,给我馆古籍数字化工作带来契机。2002年,伴随着古籍网站的开通,我们迈出了古籍数字化的第一步。之后,我们根据本馆实际情况以及读者的阅读需求,借鉴普通书籍数字化的成功经验,首先从构建小型专题数据库开始,逐步探索出一条适合我们的古籍数字化之路。而TRS信息检索发布系统以其投入少、见效快、易学易用、方便快捷、更新及时、便于维护等优势,成为我们进行古籍数字化建设的首选应用建设平台。

1 TRS概述

TRS(Text Retrieval System)信息发布检索系统是由易宝北信信息技术有限公司开发的一个体系结构先进、功能强大、面向文本数据的数据库管理系统,广泛适用于图书馆的特色数据库和学科导航库等建设。TRS信息发布检索系统可以提供简单高效的方法,使数据库中的信息根据用户的各种需求,通过Web服务器发布到互联网上,利用TRS信息发布检索系统,一方面可以把Web站点的维护工作转换为数据库记录的维护,管理海量数据,另一方面可以利用动态访问数据库技术实现信息检索、动态导航等功能。我们选择了TRS SeverTRS AdminTRS AMS三个工具。

    1.1 TRS Sever(TRS服务器)  负责建立、维护和管理各类信息资源的索引信息,并提供高并发的检索引擎;同时还具有对  各类海量信息资源进行存储和管理的能力。检索的对象既可以是传统关系型数据库中的文本或大对象信息,也可以是文件系统中的各种格式文档和网站的发布页面。它具有如下特点:支持跨平台计算:支持NTLinuxSun Solaris等主流平台;响应快;G级数据库查询速度达到亚秒级,并支持大量并发用户同时访问;检索信息快、准、全;允许使用数据库中的任意字、词、句和片段进行检索,能够满足读者高查准率和高查全率的要求;检索功能强大:全方位检索手段,可以进行各种逻辑组合检索和二次检索,检索结果可按检索表达式的相关性和重要性程度排序。

    1.2 TRS Admin(TRS数据库管理员工具)  负责完成对TRS索引和检索服务器的所有管理工作,包括建库、数据维护、安全控制、备份和恢复、优化、词典维护、系统设置等各项管理任务。其主要特点如下:方便直观的对象管理方法和快捷的数据库/视图设计界面:TRSAdmin的对象管理工具类似于Windows的资源管理器,用于管理和维护各种TRS的对象,可直接对各种TRS对象进行查看、重命名、删除等操作。用户可在数据库/视图的设计界面直观地进行设置或修改数据库的结构和字段属性、数据加载、删除等项操作,并可通过剪贴板实现对象和数据库的移动、复制、备份,减少重复劳动,提高工作效率,提高数据安全性;简单的用户管理:通过用户组/用户操作权限的控制,能够很好地提高数据的安全性,减少误操作,便于各部门间协调工作,支持多并发用户同时使用管理员工具;支持多种文件格式:PDFJPGGIFTXTMAV等。

    1.3 TRS WAS(TRS动态发布工具)  它利用数据库技术和动态网页生成技术,对Web服务器进行扩展,或采用第三方的Web应用服务器,以实现数据库信息的动态自动发布功能。它包括两个模块,一是系统控制模块,即管理控制台,可以完成用户管理、频道管理、定义各种频道和数据库之间的关系;一是WEB模块,即TRS WEB服务器,用于将数据库中的信息动态发布到WEB服务器上。通过管理控制台可以实现多种导航风格,TRS提供了灵活的模板技术,可控制数据库在Web页面上的显示风格。TRS WAS扩展模块提供了功能强大的WAS接口命令以利二次开发。更新及时,可靠性强:数据库内容的更新能马上反映到WEB服务器上,读者亦可第一时间查询到更新的信息,没有网页维护带来的延迟;从数据库中抽取信息时,不会产生死链和错链。

2 TRS在古籍数据库建设中的应用

    经过三年的努力,我们目前利用TRS信息检索发布系统已经构建了馆藏古籍精品图片库、古籍音韵书目数据库、东北地方志书目数据库、东北地方志全文数据库、《北京图书馆藏古籍珍本丛刊》索引书目数据库。其中东北地方志全文数据库因其工作量大尚在建设中。这些古籍数据库建成并发布到互联网,大大方便了全校的教师学生,他们足不出户,便可在网上检索到自己所需的信息。古籍服务手段亦从传统服务转向现代化网络信息服务。

    2.1 古籍精品图片库:这是我们利用TRS建立的第一个多媒体古籍数据库,以收录我馆所藏珍善本古籍为主。从书名,著者,版本,图片、简介等多侧面向读者展示这些珍善本古籍的一般情况,并提供书名、著者,版本等检索途径。

参见:http://202.198.25.8:8080/was40/search?channelid=2297

    2.2 古籍音韵书目数据库:共有数据478条。我校古籍研究所语言文献专业的教师和研究生经常来馆查询有关音韵方面的古籍,由于他们中有不少人对古籍检索方法不甚了解,查检起来费时费力,还不能查全,工作人员亦投入很多精力去帮助他们解决问题。有时同样的一个问题要对不同的读者重复解答,增加了工作人员的劳动强度。针对这种手工检索费时费力的现状,考虑到读者需要一个快速查询系统,以提高检索效率,我们便开始构建古籍音韵书目数据库,不仅将馆藏中有关音韵的单行本收入数据库,而且还将散见于各丛书中的此类古籍文献逐一查找,也收入该数据库中,使之成为一个馆藏音韵古籍大全,并提供书名、著者、版本等多途径模糊查询。

参见:http://202.198.25.8:8080/was40/search?channelid=16998

    2.3 东北地方志数据库:主要包括东北地方志书目数据库和东北地方志全文数据库,共有数据3227条。这是CALIS“十五”期间资助建设的特色数据库项目“东北亚研究数据库”中的一个子项目。其中书目数据库收录了馆藏东三省新旧地方志数据570条。全文数据库正在建设中,因考虑到旧志数字化的难度,我们选择了先从新志入手,逐步完成全部地方志的数字化工作。目前已经有2657条数据装库完成并发布到网上供读者检索,并顺利通过了CALIS中心的中期检查。

参见:http://202.198.25.8:8080/was40/search?channelid=23685(书目)http://202.198.25.8:8080/was40/search?channelid=3301(全文)

    2.4 《北京图书馆藏古籍珍本丛刊》索引书目数据库:《北京图书馆藏古籍珍本丛刊》是一套新印大型古籍丛书,它没有一个总目录,使读者用起来很不方便,为了方便读者查询,我们为它建立了索引书目数据库,使读者能在网上足不出户地检索到所需书籍。此库462条数据已经装库完成,正在发布中。

3 古籍数据库建设中存在的问题

    3.1 数据库建设的力度和深度不够。从我馆的古籍数字化工作来看,仍处于起步阶段,可供读者利用的电子信息资源仍十分不足,馆藏古籍数字化的比例不高,大量古籍文献有待进一步开发。

3.2 技术力量不足,人员投入少。古籍数字化与普通书的数字化相比更需要强大的技术力量支持,而目前我馆既熟悉古籍业务又有现代信息技术的人员十分缺乏,往往是从事古籍工作的对信息技术不甚了解,而从事技术工作的人员对古籍又缺乏认识。另一方面从事古籍数字化的人员较少,而且并非专职人员,尚要从事其他工作。这些因素直接影响到数字库建设的速度,亦制约着数据库开发建设的规模、深度和广度。

    3.3 数据库建设缺乏整体规划,系统性、规范性欠佳。由于我馆的古籍数据库建设尚处在起步阶段,对于数据库建设缺乏长远的整体规划,仅仅是根据目前读者的阅读需求构建一些专题数据库。虽然这类数据库的实用性很强,但是缺乏规范性,缺少与其他数据库融为一体的功能。虽然经过技术处理可以将ISO2709格式的文件转为TRS装库文件,但反向操作则实现起来较困难。


参考文献

1 樊丽娜.高校图书馆的数字化实践――TRS系统的应用.现代情报,2005(2)

2 陈力.中文古籍数字化方法之检讨.国家图书馆学刊,2005(3)

3 金莉莉.利用TRS系统制作发布全文及多媒体型数据库.图书馆建设,2003(3)

4 易宝北信信息技术有限公司.TRS4管理员工具用户手册,2000


王丽华  吉林大学图书馆古籍部工作。