特色数据库内容揭示刍议
――以《西北民族音乐学术资源数据库》为例
景月亲
(西安音乐学院图书馆 710061)
摘 要 内容揭示是特色数据库建设中的基础工作和关键环节,其揭示的广度、深度,直接关系到数据库的使用效果。文章结合西安音乐学院《西北民族音乐学术资源数据库》的建库工作实践,探讨学术资源类特色数据库基于索引理论、知识分类、主题法理论的内容揭示问题。
关键词 内容揭示 特色数据库 西北民族音乐学术资源数据库
近年来,高校特色数据库建设获得迅速发展。在CALIS特色数据库子项目的带动下,许多具有学科优势、资源优势的高校图书馆积极参与其中,陆续建成一批具有地方特色、学科特色和资源特色的数据库[1]。特色数据库已成为数字环境下高校图书馆资源建设、服务创新的重要内容。作为知识服务的重要资源,特色数据库不仅仅是信息资源的有序排列,同时还需要为用户提供知识检索与服务。因此,有关特色数据库的内容揭示就成为数据库建设与研究无可回避的问题。本文以《西北民族音乐学术资源数据库》为案例,对此略作讨论。
1 数据库的选题与基本内容
《西北民族音乐学术资源数据库》的选题,立足西北民族音乐研究,充分挖掘整合西北民族音乐学术资源,旨在为地域性特色音乐文化研究搭建数字化网络化资源平台。
西北地区是我国民族音乐文化的重要集散地,拥有极其丰富的音乐文化资源。与此同时,西北民族音乐研究以“西北民族音乐研究中心”[2]为科研基地,有来自陕西、西北乃至全国各地、香港、台湾以至海外的专家学者在“长安乐派”、“汉唐音乐”、“西安鼓乐”、“秦派二胡”、“陕北民歌”以及“唐乐舞”重建等地域性特色音乐文化研究方面取得了令人瞩目的成绩。《西北民族音乐学术资源数据库》的建设,顺应数字时代发展需求,围绕西北民族音乐研究,将相关主题的报纸文献、期刊文献、年鉴文献、会议文献以及硕士/博士学位论文等进行广泛搜集、科学标引、系统整合,最终形成具有多种检索途径,集检索查询、全文浏览、文件下载功能于一体的专题性学术资源数据库。该数据库的立项建设,对推动地域性特色音乐文化数字资源建设,促进西北民族音乐研究具有积极意义。
2 数据库的技术平台
《西北民族音乐学术资源数据库》系统采用Java语言开发。Java是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是Java程序设计语言和Java平台(即JavaSE, JavaEE, JavaME)的总称。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。系统开发采用MVC架构。MVC即模型(Model)、视图(View)和控制(Controller)的缩写,其目的是实现Web系统的职能分工。系统的后台数据库使用的是MySQL。这是一种关联数据库管理系统,它可以将数据保存在不同的表中,这样既增加了速度同时提高了灵活性。上述平台为《西北民族音乐学术资源数据库》的内容揭示、功能实现提供了技术保障。
3 数据库的内容揭示
内容揭示是特色数据库建设中的基础工作和关键环节,其揭示的广度、深度,直接关系到用户的使用效果。因此,建库中必须同时立足用户的角度,分析用户常规的和一切可能的需求特点,采取多维揭示的原则。即通过多方位、多层次描述,分析和揭示数据库资源,从而保证资源合理地有效地利用。标引数量越多,则意味着可检信息的增加和查全率的提高。《西北民族音乐学术资源数据库》在标引过程中既注重对文献一般特征的描述,而且也特别重视深入到知识单元、信息单元,扩大标引广度,以增加数据库的索引深度,提高资源信息的增值水平。
3.1 基于索引理论的内容揭示
索引,简单讲就是对某种文献或文献集合中所包含的文章或具有检索意义的事项以简明的方式分别著录标引,并将款目按一定的顺序排列和组织,以方便检索的一种工具。因此,索引可以用来揭示文献、报道文献、传递信息[3]。
《西北民族音乐学术资源数据库》收入了1949年至今60余年的各类文献资源6000篇(该数字将会继续更新),涵盖各种传统文献(包括图书、期刊、报纸、会议文献、博硕论文等公开出版物以及一些有价值的油印本和内部出版物)以及新型文献(如网络文献、数据库等)类型,其资源量大、类型多、时间跨度大。为便于用户全面了解库中资源,我们首先对全部文献逐一进行著录,并按类编排,形成《篇目索引》。《篇目索引》作为《西北民族音乐学术资源数据库》的子库,既是对库中全部资源内容的篇目式初级揭示,同时,用户锁定某一文献,点击篇目名称,也可以直接链接全文,最大限度方便用户使用。
3.2 基于知识分类理论的内容揭示
分类法是一种人工编制的信息语言。它是按照一定的科学知识体系,把相关的规则编制成可供利用的分类表,从而形成文献的知识分类系统。使用分类检索语言(分类法)建立的文献情报检索系统能够使检索者鸟瞰全貌、触类旁通,对系统地掌握和利用一个学科或专业范围的知识和情报十分方便、有效[4]。依据分类表,对文献资源进行分类标引,是文献内容揭示的主要方式。
《西北民族音乐学术资源数据库》建设中,十分注重以知识分类系统组织和揭示文献。为便于全面、立体地展示数据库资源,我们结合多种分类法以及文献资源现状,编制了《西北民族音乐研究分类表》并据此对每个条目逐一标引,以满足用户从分类角度族性检索之需求。分类表设置有4个一级类目、21个二级类目、15个三级类目、24个四级类目。既可以框架式整体展示数据库内容,同时也可以作为分类导航,引领用户进行族性或特性检索。用户点击各级类名,即显示该类全部文献的篇目索引;深入点击,即获得相关全文资料。
为弥补分类法固有的缺陷,分类表注意适度运用主题法,设立研究专题,并将其融汇于分类法中,以增强专指度。例如,覆盖几乎整个西北地区的丝路音乐研究、花儿研究专题;陕西地区的长安乐派研究、延安革命音乐研究、周秦汉唐音乐研究、西安鼓乐研究、秦派二胡研究、秦筝研究;甘肃地区的敦煌音乐研究;新疆地区的木卡姆研究、西域音乐研究、龟兹乐舞研究、维吾尔剧研究等等。这些专题的设立,使得专题内容可以相对集中且主题突出,能比较好地满足用户特性检索之需求。这也是《西北民族音乐学术资源数据库》内容揭示过程中,立足用户需求,将分类法主题法相结合着力较多的一项工作内容。
3.3 基于主题法理论的内容揭示
主题法是用语词标识的一类情报检索语言,主题标引是揭示文献内容最直接、最有效的手段,是利用主题词表,对文献内容进行主题分析,赋予主题词标识的过程[5]。
对《西北民族音乐学术资源数据库》进行主题标引,因无现成的叙词表可用,我们采用关键词(自然语言)标引。标引中,注意选取一切有检索意义的关键词,包括名词术语、民族、人名、地名、曲名、书谱名等。对于文中名词术语的同义词或名词术语的别称也注意适度选取,例如迷胡音乐,又叫眉户音乐、��戏、迷胡子;又如“西安鼓乐”,这是“非遗”申报成功后对外的正式称谓,但历史沿用下来的称谓“长安古乐”、“陕西鼓乐”也影响较大。为避免漏检,均作标引。此外,少数民族称谓与汉语对照分别标引,如哈萨克族的“阿依特斯”即“对唱艺术”。正文中不规范的名词术语同时进行规范标引,如“玛卡姆”即约定俗成称谓的“木卡姆”;“考姆兹”、“库姆孜”、“库姆兹”、“库木孜”是同一概念。对于无关键词的则调出原文阅读、分析、一一标引。关键词的数量一般控制在3-8个,在自然语词基础上尽可能提高标引的准确率,争取最大限度满足用户特性检索需求。
3.4 其他辅助性内容揭示
《西北民族音乐学术资源数据库》在对库中资源揭示过程中,兼顾到个别用户的特别需求,例如对文献类型、学位授予单位、导师姓名等专门进行标引。
另外,附设“文献源”子库,将全部文献资源的出处按期刊、报纸、会议文献/文集、年鉴、博/硕论文、图书、其他(数据库、网络文献等)几大类集中列出,从侧面展示数据库资源的广度和深度。为缓解学术资源类数据库的单调感,我们注意在页面插入一些相关的图片。图片内容按“敦煌乐舞”、“西北地方戏曲”、“西北民族歌舞”、“西北民族乐器”、“花儿表演”、“木卡姆表演”、“陕北民间音乐表演”等分组穿插于各级页面,整体展示西北民族音乐文化多姿多彩的风貌。
4 数据库的检索功能
《西北民族音乐学术资源数据库》通过题录索引、分类、主题及辅助途径,对数据库内容进行了从文献一般外部特征到正文知识信息的全方位的标引,目的在于方便用户检索使用。我们设置了专门检索栏目,共有篇名、作者、文献出处、出版/发表时间、分类、关键词、文献类型、学位授予单位、导师姓名等九条检索途径,可以进行一次检索和二次检索。
用户进入该栏目,即可以通过引导设置,选取检索路径,进行检索或二次检索;检索结果也可按要求排序;最后获取原文。检索页面设计简洁、有序,便于消除用户畏难心理,顺利完成操作。
5 结束语
特色数据库建设工作发展迅速,仅以音乐艺术院校为例,近年建成和立项建设的特色库就达70个;西北地区音乐艺术类特色库也有20个。①[6]这类数据库因其鲜明的地域、馆藏、学科特色,与商业数据库一起成为音乐艺术高校图书馆重要的数字资源,在教学科研、学科建设、艺术实践中发挥积极作用。
但是,据考察,这些数据库由于内容、性质因素,多数技术架构为网站式数据库,缺少对数据库内容的多元和深度揭示,检索功能较差,资源利用效率低。因此,随着建库工作的深入,特色数据库的内容组织与揭示及其相关技术研究已经成为数据库建设中不容忽视的问题。笔者以为,自建数据库特别是学术资源类特色库的建设应注重学习和借鉴大型商业数据库的经验。例如,中国知网作为数字化资源平台,一直致力于整合知识信息资源,为用户提供各种学术资源。目前中国知网的知识组织模式以分类、主题法为基础,采用了数据库、主题树、知识库等多种方式[7]。学习借鉴其知识组织与揭示技术,有助于提升自建数据库的知识检索与服务水平。
其次,音乐艺术院校特色数据库建设起步较晚,并且大多是自主建设,现有数据库建设普遍欠缺资源的组织与揭示意识。系统内也缺乏交流和统一监管。因此,建议音乐艺术高校图书馆联盟在今后的数据库建设工作中应充分发挥其职能作用,加强系统内外的广泛交流。建设单位应注重学习研究,避免闭门造车,不断提高建库水平,提升服务层次,促进音乐艺术类特色数据库建设整体化发展。
注释
① 据南京艺术学院图书馆朱同馆长的文章,截止2009年,国内主要的15 所音乐艺术院校图书馆共自主建设特色数据库63个。经过两年多建设发展,目前总数已超过70个。另据笔者调查统计,西北地区音乐艺术类特色数据库数量已达20个,建设单位以音乐艺术高校和省级公共图书馆为主。
参考文献
1 景月亲.音乐艺术院校图书馆特色数据库建设刍议[A]. 中国图书馆学会年会论文集(2011年卷)[C].北京:国家图书馆出版社,2011
2 西安音乐学院.西北民族音乐研究中心[DB/OL].http://subject.xacom.edu.cn/cownmy/
3 张琪玉编著.情报语言学词典[Z].北京:北京图书馆出版社,2000
4 张琪玉.分类检索语言[A]//中国大百科全书出版社编辑部.中国大百科全书:图书馆学情报学档案学[Z].北京:中国大百科全书出版社,2004
5 张琪玉.主题检索语言[A]//中国大百科全书出版社编辑部.中国大百科全书:图书馆学情报学档案学[Z].北京:中国大百科全书出版社,2004
6 朱同等.我国主要音乐艺术专业院校特色数据库建设纵览及展望[J].天津音乐学院学报,2010(3)
7 马捷等.中国知网知识组织模式研究[J].情报科学,2011(6)
景月亲 女,1967年生,西安音乐学院图书馆研究馆员。