编制地方文献索引数据库的体会
发布时间:2018-09-21  浏览次数:43

    佳木斯市图书馆是一个中等城市公共图书馆,地方文献是馆藏一大特色。去年试用索引学的原理,用人工和电子计算机相结合的办法编制地方文献索引数据库,现经验收正式投产,争取明春投入使用。现将我们认识和作法整理成文,以便向同行求教。

1 文献特点和读者需求是编制索引的依据

   编制地方文献索引是一项复杂艰巨的工作。首先,地方文献具有范围大、时间长、载体多等3个特点。包括我馆现有中文图书、报刊、及其他载体中反映佳木斯地区政治、经济、文化、历史、地理、风土人情、名人传记等内容的文献。涉及历史学、社会学、地理学以及政治、经济、文化和自然科学等许多学科,照片、地图、光盘、录相带、剪报、单篇文件资料、手稿也有相当数量。其中,有大量内部出版物和非出版物。

   其次,地方文献面向社会,读者对象有工人、学生、教师、科研人员、机关干部、作家、宣传媒体工作人员等多层次、多种成分人员。他们查阅地方文献的目的有的是一般阅读、学习知识,有的是为了编写教材、写作宣传材料,有的是从事科学研究、写作论文。多层次的读者群必然带来多种需求。

   第三,地方文献是图书馆收藏中最有价值的文化遗产,应考虑后人的检验和需求。

因此对索引编制者要求较高:①必须熟悉地方文献的内容,了解各个时期的各类事物、事件的发展变化情况,才能择要精选主题。②必须选择适应各类读者检索的索引类型,尽可能增多检索途径,组成能够查找多个文献内容单元的索引网络,强化检索功能;③索引系统、索引款目、索引语言必须易懂、易检;④最重要的是检中率,要使读者提出的各种问题都尽可能的检索到,尽可能不漏检、误检,以此作为编制这部索引的最高目标。

2 编制索引的几项基础工作

    (1) 界定收录范围。由于地方文献范围大,时间长,载体多样的特点,必须通过精选保证索引的质量:①只收本馆现有文献。②对历史上反映佳木斯地区的文献纳入收录范围,但是行政区划划出的市、县均从划出之日起不再收录。③侧重选收资料性、史料性强的文献,对技术方法、管理方法和一般理论研究的文献不收。④以编制的类目表为界限,未列入类目表的内容不收。⑤列入的类目限定收录范围,如:人物包括:A历史人物(解放前佳木斯地区产生过重要影响的正反面人物)B市级以上革命领导干部;C革命英雄、革命烈士;D市级以上劳模和先进工作者;E各行各业杰出代表人物。再如各类经济,只收生产发展变化的综合资料、市委、市政府重大措施和年度效益。

    (2) 标目的标引,从文献的篇名和内容中编选各种类型的索引标目称为标目的标引。根据设计拟建立的地方文献索引数据库应具有题录索引、人物索引、地名索引、单位索引等几种类型索引的功能。对标目的标引解决了以下几问题:

    ① 题录索引的篇名标引

   编制题录索引必须首先解决地方文献多种类型文献如何统一按篇名标目的问题。我们规定为:报刊均以原有自然篇名标引;图书以书名作为篇名标引,若图书中仅部分章节属于佳木斯地方文献内容,则以章节名称作为篇名标引。文集、汇编等有多篇文章的,以各篇文章的篇名标引;重要的照片、地图、单篇文件及录相带、光盘均应著出篇名,以篇名标引。

   题录索引是以篇名所包含的主要主题概念按类序法整序的。在地方文献中这一主要主题概念应当定位为揭示地方文献内容的主题概念,我们将其称为地方文献主题概念。这一主题概念必须反映:a为什么将这篇文章收入地方文献;b属于地方文献类目表的哪个类目。如:《乌苏春秋》是篇纪实小说,被列地方文献是因为其内容描写了1946年饶河县土地改革的情况,归入解放战争时期的土地改革史料类。

   按照上述原则在篇名标引中选择了三种方法:a原篇名照录。适用于篇名不长,且主题概念清楚。b删节。对原篇名较长,特别是报刊文章。一般是删去其只有虚词的肩题或副标题,保留能反映地方文献主题概念的主标题内容。c加注。篇名中地方文献主题概念不清应加注标出。基本有两种形式,一是加副标题,如《舞台上下五十年》加副标题后标为:《舞台上下五十年――评剧表演艺术家李岱山生平事迹》归入人物传记类。二是加括号注出,如《黑瞎子与狐狸》加括号标注为《黑瞎子与狐狸(赫哲族民间故事)》归入赫哲族类。

   ② 人物姓名的标引。规定人物姓名只标引符合收录范围规定的重要人物。著者目录不单独存在,其中符合重要人物的亦在此项标引。对人物的曾用名、别名等均加括号在常用名后标出,由于机检时键入任一个人名都会一起检出,不再作轮排和参照结构。

   ③ 地名的标引。规定考古发掘、重要事件发生地均须标引出村、屯名或山川名,但一定要连同市、县名一同标出。凡是地名变迁的要将原地名加括号标于现地名之后。在机检中原地名与现地名会一同检出。

   ④ 单位名称的标引。单位名必须标引全称,并连同市、县名一起标出。已变更的单位名加括号,标于现单位名之后。机检时可一同检出。

    (3) 编制款目结构。索引的款目结构是揭示文献资料单元的线索,是索引系统的基本单元。我们采用以题录索引作为主要索引,人物、地名、单位索引作辅助索引,统一使用题录索引的款目结构。

手工索引的款目结构由于受标引文字的限制常常过于简略,仅从款目不能准确理解文献内容,影响检中率。我们采取在款目中增设一个附加说明项的办法,代替了所有的参照结构。其内容有:a揭示篇名未能表达出来的文章内容。如事件的性质、简要过程、发生地点和起止时间;人物曾用名、别名,在文中的时间、地点和身份、职务。地名的变更、由来及所属市、县;单位名的变更、由来和所在市、县。b文章内有珍贵的资料,附件、重要附表、照片、地图、名录等均应注明。这项规定提高了索引标引的深度,代替了索引系统中设立许多限制词、说明词和参照结构的繁琐。虽然文字多些,但因语言简炼、通俗易懂,受到读者的欢迎。

    (4) 排序方法的应用。索引编制和检索中款目的排序占有很重要的地位。没有排序就不可能组成索引系统,形成索引的功能。传统索引理论使用类序法和字序法,我们体会应当重视时间排序法的作用。

   ① 编制类目表。题录索引是以篇名的主要主题概念按类序法排序的。关键是编制出一部实用的类目表。由于《中图法》是按学科分类,而地方文献侧重按事物、事件、人物分类。因此必须依照地方文献的内容自编类目表:a将最常见、最重要的专题放在突出地位单独立类,如“行政区划和建置沿革”、“著名人物传记”、“重要单位事迹”、“赫哲族”设为一级类目;b独立专题的类目之间没有逻辑关系,但各类内部的下级类目和上级类目之间必须严格按逻辑关系设置类号。c尽量减少类目的级次,一般只设二级类目,少数文献量较大的设三级类目。使类目表清晰简捷,便于归类和检索。类目及其说明和注释主要使用了规范主题词、为在计算机上利用语词检索创造了条件。

   ② 人物、地名、单位名三种索引使用汉语拼音音序排序是计算机自动生成的,在应用中比较顺利。

   ③ 按时间排序在编制和使用索引数据库有极其重要的作用。我们规定在输入每条索引数据中要包含一个时间项,尽可能准确的标出地方文献中事件发生的日期。其中历史人物和革命领导干部标引其到达佳木斯或佳木斯任职之日期;劳动模范、先进人物标引出被授予荣誉之日期;优秀运动员标引创造纪录或夺取名次之期;科学家标引研究成果被评定之日期;国家领导人视察标引到佳木斯之首日;革命英雄标引在佳木斯参加革命之日期;革命烈士标引其牺牲之日期;文章、讲话著人和标引其出版、发表日期。在索引数据库中时间成为一个检索点。并具有排序功能。对题录索引、人物索引、单位索引都有二次排序、三次排序的功能。如它在题录索引按类排序后使各类的款目再按时间先后排序。如抗日斗争史料,按时间排序,对研究抗日斗争历史有很大方便。

    (5) 填写工作单。工作单是人工完成的各项工作成果的汇总,也是完成机编索引数据库的最后准备。工作单共设有9栏。其中第一部分是题录索引的款目结构,有篇名、著者、出处等三项,另外有一个附加说明项。第二部分是人物、地名、单位索引的标目,这些标目可以利用第一部分的基本款目组成各自的索引款目结构。第三部分是类目表的类号栏和时间栏,这两个是排序的标识符号。

3 使用电子计算机建立索引数据库

   使用电子计算机编制索引数据库进一步应用了索引系统结构的三个规律:同聚异散律、有序律、异排律,同时又充分发挥电子计算机的各种功能。我们设计制作的地方文献索引数据库应用软件共有4个界面,各有其独特的功能:

    (1) 输入界面的功能。具有输入、储存、建库的功能。共有篇名、著者、出处、附加说明、人物、地名、单位和类号、时间等9栏,与工作单的格式完全相同。按照格式准确输入即可完成建库。其中除附加说明项内容不直接在界面反映,其他8项均有检索、聚合、排序的功能。每输入一次即可完成分属于题录、人物、地名、单位等4个索引的功能。在输入界面上还带有浏览、编辑修改和链接已输入数据的功能。

    (2) 检索界面的功能。检索界面是地方文献数据库最重要的界面。它体现数据库的主要功能:

滚动浏览检索功能,采取列表显示的办法将每个输入界面的一组数据列为一格,一个界面同时可浏览20多条数据,并可用鼠标拖动浏览,为检索提供了有利条件;

   聚合、排序检索功能。在人物、地名、单位、类号、时间等5项作了排序功能的限定,只须在界面上点击列标头上的名称,即可实现数据聚合排序,类号使篇名按类聚合和排序。人物、地名、单位分别按人名、地名、单位名称聚合,按汉语拼音音序排序;类号使篇名按类聚合,按类目表类号次序排序。时间使全部数据由远至近聚合排序。这就使界面上出现了题录、人物、地名、单位4部索引数据库。读者可按类别和音序查到大部分所需的数据;

   专指对象检索功能。如已有明确查找对象,可通过键入专指的篇名、人名、地名、单位名称查到所需要的数据。如检索人物。只要键入人名“张闻天”或“洛甫”即可将在人物传记类中的张闻天传记,以及在党的建设、土地改革各类中的“张闻天”言论的文献款目全部集中在一起,为研究张闻天1946年―1948年在合江工作期间的情况提供了系统的资料线索。地方文献索引数据库收录了佳木斯市各届党政领导人员,各界名人活动的资料线索,只要键入人名即可将他们每个人的事迹、讲话和重要活动文献线索全部查到。一人多名者,不管键入哪个人名都可将其资料线索全部检出;

   多层次逐级检索功能。第一层次可将人名、地名、单位名标目的标引名称检出(同名称者全部聚合在一起显示出来),确定检索对象。第二层次可在界面上通过通用款目的篇名、著作、出处等检索到检索对象在文中的地位。如检索李范五的人名可了解李范五是作者还是被描写的对象。第三层次检索可通过附加说明项的记载了解他1946年担任省工委书记的主要事迹。通过三个层次不断加深资料线索,读者完全可以确定是否是自己要检索的文献对象;

   分解、重组、异排检索功能。通过逻辑操作,使用大于、小于、等于、包含等标识符号,对各种数据重新进行分解、组合和重新排序。使检索点大大增加、扩大了检索内容和检索深度。如对篇名可分解成字、词、短语进行检索,具有了逐字索引、语词索引的功能。如使用“粮食”一词检索即可把原在农业经济类的粮食生产、工业经济类的粮食加工、商业贸易类的粮食贸易有关粮食的内容全部集拢组合在一起,再按时间排序,对系统研究粮食问题提供全面资料线索。如在农业经济类中包含的种植业、畜牧业、饲养业、水产业、渔业、农家副业、乡镇企业等是混排的。使用语词检索,只要键入以上任何一词,即可将其内容单独聚合排列。这样做可以节省大量类目。具有可查阅农业经济总的情况,又可检索其中某一项内容的功能。同样,对人名、地名、单位名的查找只要键入关键词或字即可实现检索目的。

   链接检索功能。附加说明项因文字较多,没有排入检索界面列表,只在列表格式项目中标注了“MEMO”的代码,用鼠标点击即可显示为附加说明项单独设立的界面。附加说明项界面的文字量不受界面限制。

    (3) 印刷界面的功能。地方文献索引数据库具有自动生成题录、人物、地名、单位等4部文本索引的功能。为此设计了一个印刷界面,预先将要印刷的文本索引(或其部分内容)调入,进行预览。确认无误之后再打印出文本索引。

    (4) 图片界面的功能。以链接方式浏览储存于计算机硬盘或光盘上的与地方文献相关的照片、地图、表格等。

通过以上多个界面和检索功能的设立,组成了较为精细的索引网络功能。为了检验数据库的功能,模拟各层次读者的检索要求作了多次实验,通过补充完善,均可提供丰富的资料线索。

4 索引编制工作一定要统一、规范

   索引编制的统一、规范是全部索引工作的生命线。决定着索引的质量。为了解决这个问题我们制定了一部《索引编制办法》,对索引文献对象,收录范围,文字使用等各项问题做了明确规定。同时进行多次培训。并建立各种规章制度,就连文字的体例都作了规定。事事有法可依。工作单填写后要作两次审核方可输入计算机。严格的规定和审核制度使所有工作人员编制索引的行为完全一致。确保了数据库建设的质量。

我们自知这部索引是很粗糙的,或许不符合索引学的基本原理,以索引的检验标准衡量有许多不合格,在此向索引学的前辈、电子计算机专家和广大同行求教。

   王微 佳木斯市图书馆地方文献研究室索引课题组馆员

 (佳木斯市图书馆)