现代的索引就是数据库
发布时间:2018-09-21  浏览次数:45

    文  :本文从索引工作现代化、数据库与传统索引在结构与功能上的比较、数据库推动了索引工作的现代化、数据库扩大了索引原理的应用、数据库对索引学发展的贡献几个方面,说明“现代的索引就是数据库,现代的索引工作者就是数据库建造者”这一观点,指出“当前索引事业发展的重点是数据库建设”。

    关键词 :文献数据库 索引工作现代化  索引事业发展趋势 索引学理论


1 索引工作现代化和现代索引的概念

    索引工作现代化的实质就是索引编制和使用的计算机化。用计算机编制索引是索引技术发展的高级阶段。不但在一些信息技术发达的国家,各种索引都利用计算机编制,即使在我国,利用计算机编制索引也已相当普及,用手工编制索引已越来越少。

    用计算机编制索引有两种方式:一种方式是手工编制索引稿,再输入计算机编排和生产各种索引产品;另一种方式是直接在计算机上制作索引数据和生产各种索引产品。

     用计算机生产的索引产品有多种载体形式,其中以数据库(数字化索引)和印刷型索引为多见。特别是数据库,由于有许多无与伦比的特点,因而发展迅速,数量已远远超过了印刷型索引。80年代以来,我国索引悄悄地、越来越多地以数据库的形式出现,这是为什么在当今信息时代,我国出版的印刷型索引反而越来越少见的原因。

    现代的索引就是数据库,现代的索引工作者就是数据库建造者。

2 数据库与传统索引在结构与功能上的比较

    数据库在功能上相当于传统索引的一个索引体系。数据库包含许多字段,一部分字段相当于文献款目的各种著录事项,另一部分字段相当于文献的各种检索标识项(如分类号、主题词、题名、著者等)。后者一般是每一字段生成一个索引,通过索引对数据库进行检索(但也可不通过索引直接对数据库的相应字段进行检索)。所以,一个含有分类号、主题词、题名、著者字段的数据库相当于分类索引、主题索引、题名索引、著者索引四套卡片式索引,或相当于一种按详细分类排列正文并附有主题、题名、著者三种索引的检索工具的功能。数据库的一个重要特点是数据的最少冗余,例如,在传统索引中,题名和著者既作为文献著录的项目又作为文献检索标识时必须重复著录,而在数据库中则无必要重复。在传统索引中,诸如出版地、出版年等是不可能作为检索标识使用的,而在数据库中,必要时也可作为可检字段提供检索(一般是作限定检索)。数据库在检索上最主要的优点是可以用多个同一种类的检索标识或不同种类的检索标识进行组配检索(多种条件的联合检索),这是传统索引所难以做到的(比号索引和比孔索引除外)。此外,数据库还可用于文献计量和情报研究。

    可以说,传统索引的全部检索功能,在数据库中都能实现;而数据库有许多检索功能,却是传统索引所不能实现的,数据库比之传统索引有更多的检索功能。数据库是比传统索引更为高级、更为先进的索引。

3 数据库推动了索引工作的现代化

    数据库这种现代的索引形式,其编制和使用技术的广泛应用,推动了索引工作的现代化,具体体现在下列三个方面:

3.1 在机编索引(通过建立数据库,再由数据库生产印刷型索引)方面:

    (1) 利用计算机编制索引可以一次输入、多次多种输出。即索引数据一次性输入并校对正确后,可以根据具体需要生成不同检索途径、不同范围、不同格式、不同载体和份数多少不限的各种索引产品;

    (2) 提高索引质量,诸如提高索引的标引深度,规范款目格式,减少手工编制时抄写、排序、打字或排版过程中的差错等;

    (3) 加快编制速度。由于减少了抄写、校对等工序,以及加快了排序、打字或排版、累积以及编制轮排款目等的速度,因而可大大缩短由一次文献(原始文献)到二次文献(索引产品)的时差;

    (4) 索引更新(增补)和累积(编制累积本)十分容易,这是使索引产品长期保持使用价值的一个重要条件;

    (5) 作为机编索引副产品的数据(或直接建立的数据库)可开展各种索引服务;

    (6) 可以编制各种手工难以编制或无法编制的新型索引。

3.2 在自动标引方面:利用计算机可进行自动抽词和自动赋词、自动赋分类号(一种自动分类方法),使索引编制过程达到很高的自动化程度。此外,目前正在普及的全文数据库,则可免除标引工序。

3.3 实现检索自动化。利用数据库进行计算机检索和网络检索,不但可千百倍地提高检索速度,而且还可使用各种各样的检索技术,大大提高检索效果。

4 数据库扩大了索引原理的应用

    数据库的检索原理其实就是索引原理的新发展。目前数据库的类型极多,可按其性质、专业内容、语种、载体、使用技术等予以分类。按其性质,大体可分为文献数据库和非文献数据库。文献数据库又可分为文献目录数据库(包括机器可读目录、题录数据库、期刊目次数据库、文摘数据库、引文数据库等)和全文数据库;非文献数据库可分为数值数据库、事实数据库、图象数据库、多媒体数据库等。不但在图书馆、情报、档案专业领域普遍利用数据库,而且各行各业也广泛利用数据库进行管理和服务,可以说,在当今信息社会,数据库是一种最基本的管理和传播信息的工具。这从某种意义上说,是大大扩大了索引原理的应用。

5 数据库对索引学发展的贡献

    数据库的出现大大丰富了索引学的内容,推动了索引学的发展,具体体现在下列三个方面:

    一是推动了索引编制技术的发展,创造了许多新的索引方法,特别是自动抽词、自动赋词和赋分类号等索引编制新技术;

    二是推动了检索方法的进步。自数据库出现后,创造出了适用于数据库的许多新的检索方法,如布尔逻辑检索法、加权检索法、扩检、缩检、改检方法、二次检索法、各种标识联合检索、截词检索、模糊检索、成批检索、SDI服务、回忆检索过程、保留检索课题表达式、检索对话,等等;

    三是推动了索引用语言(情报检索用语言)的创新和改造,最重要的是索引语言的组配化和自然语言的应用。

6 当前索引事业发展的重点是数据库建设

    既然现代的索引就是数据库,索引事业发展的重点就应放在数据库建设方面。虽然印刷型索引的某些种类(如书后索引)仍应大力发展,但就整体而言,印刷型索引已失去发展的有利条件,例如,出版补贴就是印刷型索引发展的一个很大的障碍。

    数据库是因特网发展的重要支柱之一。随着因特网的发展,数据库建设已成为非常迫切的问题。因特网将成为整个社会信息化的一个重要因素。但是,如果没有大量数据库的支持,就好比造好了信息高速公路,但没有载着货物(信息)的车辆在上面行驶,因特网也就形同虚设,不能充分发挥其信息资源共享的通信设施的作用。我国通信设施建设发展很快,但因特网上信息资源(中文信息资源)太少,也就是说联网的中文数据库太少,是一个亟待解决的问题。对我们索引工作者来说,这是一种历史任务,也是一种严重的挑战。

7 推动传统索引与数据库的结合

    我们强调数据库的重要性,认为索引工作的重点应放到数据库建设方面,并不意味着抛弃传统索引及其原理和方法。

    传统的索引著作,有些至今仍有使用价值,可以将其转换成数据库,使其继续发挥作用甚至发挥更大的作用。

    传统索引的某些原理和方法,如某些古籍索引的原理和方法,也可引进数据库,以开拓数据库的应用领域。

参考文献

张琪玉.关于索引学研究和索引工作开展的设想与建议.江苏图书馆学报,1993(1)3-7

张琪玉.推广文献索引计算机编制法是促进我国索引事业发展的一项重要措施.图书与情报,1996(2)33-36

张琪玉  南京政治学院上海分院信息管理系教授,情报语言学专家