特色数据库的内容揭示 ――以基于TPI平台的张謇研究特色数据库为例 端木艺
发布时间:2018-09-25  浏览次数:26

特色数据库的内容揭示

                           ――以基于TPI平台的张研究特色数据库为例

端木艺

(南通大学图书馆  226019

    本文以张研究特色数据库为例,从数据库结构、元数据标引、数据库发布等方面,探讨了高校图书馆自建特色数据库的内容揭示问题。

关键词  特色数据库   内容揭示   研究

 

1  数据库选题

在商业数据库制作公司已经占领数据库市场,制作技术和售后服务都日益完善的今天,高校图书馆自建特设数据库主要是为填补空缺,为满足本校教学科研需求,选择商业机构现在没有做,将来一段时间内也不会做的比较专门的领域来建。

是中国近代著名实业家、教育家,在清末民初中国政治、经济、文化舞台上极其活跃并产生过重要影响的历史人物。他在经济、教育、文化、城市建设、社会保障、地方自治等诸多领域创造了十多项全国第一,是一位探索强国之路的开路先锋,是南通“中国近代第一城”的缔造者,也是南通大学的创办者。研究张对于今天的经济、教育、文化协调发展,实现可持续发展具有重要意义。研究张的专家不仅在江苏,在全国(包括港澳台),在日本、韩国、新加坡、美国、英国、德国、法国、荷兰等国都有。因此,为促进张謇研究,促进南通大学的江海文化研究平台建设,南通大学建设了张研究特色数据库。这项工作有利于充分挖掘和利用张謇研究文献资料,实现张研究的数字化网络化,对于实现地方文化研究的数字化整合,促进南通大学图书馆数字化进程,丰富江苏省高等教育研究资源都具有积极意义。因此,2004年底,江苏省高等教育文献保障系统(JALIS)启动二期工程建设,南通大学图书馆申报了张研究特色数据库。20056月,由JALIS管理中心正式列入江苏省高等教育文献保障系统二期工程建设特色数据库建设子项目。现已通过江苏省教育厅验收,在JALIS主页特色数据库栏目、南通大学主页校园文化栏目、南通大学图书馆主页发布。

2  数据库构成

研究数据库的目标是建设成为本省具有一定地方特色的地方重要历史人物的具有题录、全文和多媒体资料的收录全面的特色数据库系统,为海内外张研究学者,为地方教育、文化、经济发展提供网络共享资源服务。数据库建设所有技术标准一律采用中国高等教育文献保障系统(CALIS)规定的标准,按不同文献类型,分为10个子库,各子库名称和收录范围详见表1

1  数据库各子库名称及收录内容

研究期刊论文数据库

收录国内期刊以及部分国外期刊上发表的关于张研究的论文文摘,包括部分全文。

研究会议论文数据库

收录学术会议以及学术论文集中关于张研究的论文文摘,包括部分全文。

研究报纸论文数据库

收录国内报纸上发表的有关张的文章文摘,包括部分全文。

研究学位论文数据库

收录有关张研究的学位论文,包括部分全文。

研究著作数据库

收录关于张研究专著的目录。

研究网络导航库

收录互联网上与张有关的网页网址。

研究多媒体数据库

收录与张有关的音像资料。

研究图片数据库

收录与张及南通有关的图片。

著述数据库

收录张全集篇目;张全集补遗全文;张全集全文。

演示文稿

收录有关张研究的演讲文稿。

3  平台选择

江苏省高等教育文献保障系统(JALIS)在通过CALIS认证的软件中推荐了5种软件,除TRS未提供测试软件外,我们对其余4种系统软件做了全面测试。从方便制作、系统兼容性好、便于扩充、以及性价比等方面考量,最终选择了清华同方的TPI

4  内容揭示

特色数据库的内容揭示是数据库建设十分重要的环节,揭示的深度直接关系到用户的使用效果,本数据库文献类项多,语种多,时间跨度长,因此,必须多维度建构索引体系。

4.1  字段设置

字段设置即数据库结构设置,字段的多少,直接决定检索途径的多少,决定对数据库内容揭示的深度。张研究特色库所收录的文献有研究专著,期刊、会议、报纸、学位论文,图片、多媒体、演示文稿、网络导航等多种类型,各类文献的数据格式严格按照CALIS规定的格式。根据CALIS的要求,我们对各库的字段设置齐全,部分CALIS没做要求的字段或文献类型我们也根据需要设置,我们严格按照CALIS规定的元数据规范,制定了《张謇研究特色数据库各子库字段(JX04-11-02-04-01)》、《张謇研究特色数据库著录说明(JX04-11-02-04-02)》并上报JALIS中心项目管理组,经管理组批准后正式执行。

4.2  标引

数据标引是数据库内容揭示的关键,我们在元数据标引中,对张全集、各类研究论文,将全文扫描识别后输入全文字段,以便用户从全文途径检索。对没有摘要部分的论文,取第一小节作为摘要。对图片则由标引人员根据相关资料编写简介。我们尤其重视主题标引和导航标引。

4.2.1  主题标引

研究没有现成的叙词表可用,因此我们采用关键词标引。张研究数据库收录的文献类型多,除近几年发表的学术论文之外,大多文献没有标明关键词,需要阅读全文后从中找出关键词。有的词在原文中不出现,需要作一番考证才能准确标引。

例如人名:张全集中涉及的人物众多,清末民初的人物之间的称呼常用字、号、官职、地望(籍贯)等,对这些称呼,不仅要用原文中的写法标引,还需标出人物的本名。如张的信函《致星查》,原文中没有出现“星查”的姓和本名,据赵鹏先生《张謇致星查信函考》一文考证[1],星查本名徐绍垣,曾任海州盐运分司,广东香山人。因此,关键词还要标出“徐绍垣”。

又如《答南皮尚书条陈兴商务、改厘捐、开银行、用人才、变习气要旨》、《上南皮相国请京师建设帝国博览馆议》两篇中的“南皮尚书、南皮相国”指张之洞,张之洞祖籍直隶南皮(今河北南皮),故尊称为张南皮,而清代并无相国、尚书职位,张之洞任军机大臣、大学士,相当于相国、尚书,故称南皮相国、南皮尚书。张不能直呼张之洞本名,所以“张之洞”这个词不出现在原文中。但我们做关键词标引,就必须标出“张之洞”。

4.2.2  主题标引中的同义词问题

在近代史上是一个重要的人物,他交往的人物,经历的事件,创办的企业事业,涉猎的面非常广,张研究涉及近代史研究的方方面面。其中有很多人名、事件名、企事业名称,这些词语都存在同义词的问题:人物的字、号、别名、尊称等,事件的简称、别称等,企事业的全称、简称、原名、集团的分支机构等,在标引中都需注明。当然,在关键词字段不可能标出所有的同义词,只能标出人物的原名,事件、企事业的全称。因此,要提高标引准确率,应该引入同义词表或叙词表,或关键词-叙词链接模块,用户输入同义词表中的任意一个词,都可对同组所有词检索。或做到输入一个词,弹出同义词对话框,显示同组所有同义词,供用户勾选,然后对所选同义词检索。TPI系统目前还没有同义词词库模块,笔者曾多次建议同方公司增加这个模块,供各个数据库建设自己的同义词库,但在目前的版本中,还没有增加。《张謇全集》标引中遇到的问题,也是古籍标引中的共性的问题,没有同义词表,不能解决漏检的问题。所以我们准备嵌入一个同义词表,或一个知识库。

4.2.3  导航标引

我们在张数据库中设置了两种导航方式。

TPI的分类标引有两种方式,一是在分类号字段标分类号,检索时从检索提问框输入相应的分类号,检得相匹配的记录。二是分类导航,便于不熟悉分类号的用户从分类表中逐级检索,TPI系统采用鼠标拖拽的方法建立分类表与记录之间的关联。张研究数据库中有大量涉及多个学科的文献,如对张与日本企业家涩泽荣一的比较研究《张謇与涩泽荣一儒商思想的不同特征及其不同境遇的原因》,涉及中国经济史、日本经济史,中国近代史、日本近代史、跨文化研究等;对张謇诗与韩国流亡诗人金沧江诗的比较研究,涉及中国近代史、韩国近代史、比较文学等。对于跨学科的文献,我们给出多个分类号,并在导航中同步操作。

为便于不熟悉中图法分类体系的用户,我们制作了一个主题导航,但这不是严格意义上的主题,而是按张研究所涉及的领域和研究者的习惯,编制的层级式的专题导航。在TPI系统中,导航标题和层级可以按需要随时修改,我们针对不同的文献库制作相应的主题导航。

5  检索功能

对数据库内容全方位标引、深入揭示的目的是便于用户检索。TPI的检索模式为:初级检索――每次选择一个字段检索;高级检索――可选多个字段,支持字段内和字段之间的布尔逻辑检索。单库检索为每个库的所有可检字段,跨库检索为所选各库的共有可检字段,快速检索为所有单库的共有字段。因此在数据库发布模块,要将用户有可能作为检索入口的字段设为可检字段。可检字段的显示排列,根据检索频率的高低,检索频率高的字段排在前列。

对于特色数据库建设,江苏省教育厅、江苏省高等教育文献保障系统,要求各数据库建设成优质教育资源,便于共建共享。本数据库建成后,由于特色鲜明,服务于科研和地方经济文化建设,实用性强。文献类型丰富,资料收集时间跨度长,内容齐全,更新快。硬件有专业服务器,网络通讯稳定。软件选用符合CALIS标准,便于共享。数据组织、数据标引规范。检索途径多,界面友好方便。服务功能较完善,运行正常。得到张研究学者的高度肯定。成为南通大学江海文化研究、张研究的重要资源;省级优秀课程(古代文学)的课程资源。并已在JALIS共享。完全实现了省教育厅和JALIS的要求。

我们还将不断更新数据,提高标引质量,完善服务,实现可持续发展。

 

参考文献

1  赵鹏. 謇致星查信函考//研究中心.《张謇全集》补遗、校勘活页选(一). 南通: 研究中心编印,2003:14-17

2  中国数字图书馆标准规范建设项目组.中国数字图书馆标准规范建设.2007-10 http://cdls.nstl.gov.cn/

3  CALI专题特色数据库子项目工作组.CALIS专题特色数据库子项目标准规范.2004.6

 

端木艺  女,南通大学图书馆副研究馆员,中国索引学会理事,长期从事文献检索教学和参考咨询工作。发表论文20多篇,主持省教育厅课题3项。