数字图书馆信息资源建设应注意的几个问题
发布时间:2018-09-21  浏览次数:112

    文    随着网络基础设施建设的逐步完善,数字图书馆建设开始进入信息资源建设为主的新阶段。本文从认识、标准、内容、质量控制、技术等方面提出在数字图书馆信息资源建设中应该注意的问题和具体的解决办法。

    关键词 数字图书馆  信息资源建设  特色数据库


    随着现代信息技术革命的深入发展,“数字图书馆”不仅成为近年来图情界热门话题,而且也成为21世纪图书馆事业发展的方向和主旋律。当前,我国的数字图书馆建设已经随着网络基础设施建设的逐步完成,开始进入数字化信息资源建设的新阶段。作为数字图书馆建设的基础和核心内容,数字图书馆建设进入数字化信息资源建设阶段,标志着我国的数字图书馆建设已经取得实质性进展。

    由于数字图书馆至今还没有一个成熟的参考模型,有关数字图书馆的研究和学术理论也是各执一词,互不统一。信息资源建设与信息网络建设相比,是一项更为长期、更为艰苦的工作。笔者认为在数字图书馆的信息资源建设过程中,应该重点注意以下问题:

1 对资源建设的认识问题

    虽然对数字图书馆理解不同,但有一点是大家所共识的,即图书馆管理系统(采、编、流、检、连续出版物管理)的功能延伸并不是数字图书馆,拥有海量的有组织的数字化信息资源才是数字图书馆的“物质”基础和核心,才是数字化图书馆的根本内涵,没有一定规模的信息资源,数字图书馆也就无从谈起。数字图书馆是实用系统,是建设过程,永不终止。因此,信息资源建设是数字图书馆建设的核心内容,我们在认识上必须把信息资源建设作为在数字图书馆建设中重中之重,绝不能重硬轻软或重硬重软,忽视信息资源的建设。

    数字图书馆信息资源建设的内容一般包括馆藏文献数字化和网络资源馆藏化,而数据库的开发是信息资源建设的核心。在当前图书馆经费缺乏的情况下,大规模的馆藏数字化是不宜提倡的;引进电子资源应适可而止,更何况数字图书馆是买不来的,买来的资源终归是别人的资源。当前图书馆还是应该凭借在信息的筛选、分类、组织、标引、优化等方面的优势,加强二次文献库的建设,同时利用互联网提供的巨大信息资源建立各种专题库、导航库,以点代面,逐步推进信息资源的建设工作。

    同时应该注意的是,信息资源建设工作不仅仅是简单地进行数字化转换、购买电子文献或者下载网上资源就行了,它实际上是一项超大规模的信息资源在数字状态下重组和再创造的创新工程,图书馆必须对来自各方面的信息资源进行系统的整理、分类、合并和集成,通过二次文献的归并、二次文献与一次文献、一次文献与引文的链接等工作,使相关的多元化信息和不同系统有机融合并实现信息资源的统一检索、管理和认证,加强信息资源的组织、管理,为提高信息资源的利用率而服务。

2 资源建设的标准问题

    数字图书馆信息资源建设的过程,实际上就是将资源电子化、数字化后建成各种类型数据库的过程。因此在建库过程中,必须严格遵循和充分利用各种正式标准,尽量避免不依规范和标准而盲目建立“简易格式”库和非标准数据库,导致大量信息资源不能相互交换和集中的现象。即使少数不是严格按标准格式进行组织的资源库,也必须考虑对数据项的充分描述,在建库时留有余地,并对以后的数据转换与衔接留有灵活的接口。

    但同时我们也不能过分强调标准化,而忽视信息储存和检索的效率。目前有关数字信息资源建设的相关新标准比较多,如元数据标准、检索语言标准、数据描述语言标准、电子图书标准等,但真正成熟并全面推广应用的标准比较少。鉴于这种情况,图书馆在信息资源建设时,应尽量应用成熟的已有标准,同时考虑适合发展需要的标准,在实现信息资源交换的基础上将工作重心放到信息资源的快速检索、快捷传递和方便利用上。

    综合国内外数字图书馆信息资源建设的经验,我们建议在二次文献的数据记录结构与记录格式上,仍采用基于ISO2709的文献格式标准(具体为CNMARCCCFC),这样既能和国际接轨,也能充分地利用图书馆自动化过程中形成的数据;而对图像或者全文数据,目前国内已有PDGPDFNLCCAJ等格式,我们建议不宜采用PDGNLCCAJ等单一厂商推行的格式,而应采用国际通行的PDF格式标准或者MLXML格式。

3 资源建设的侧重点问题

    信息资源建设是一个知识密集、劳动力密集的工作,需要投入大量的人力和物力,在经费有限的情况下,图书馆不可能有庞大的人力、物力去建设“大而全”、“小而全”的信息资源,也没有这个必要。因此,各图书馆在信息资源建设过程中,必须采取有所为有所不为的方针,有所分工,有所侧重,应立足本馆馆藏特色和学科优势,以特色数据库建设为核心,将本馆馆藏最具特色的信息资源和用户最需要的信息资源,作为图书馆数字信息资源建设优先选择的对象。

    实践证明,图书馆的信息资源不能完全依赖外部,必须走自己的路,实现本馆特色;只有特色数据库才受欢迎,只有提供特色数据库的数字图书馆才有生命力。因为特色数据库资源一般都以特定的地域、特定的行业、特定的主题为基本内容,具有独创性和排它性,可充分满足用户的个性化、专业化的需求;而各馆通过特色数据库的建设,不仅可突出馆藏特色和科研方向,为教学科研提供高层次、高效率的信息服务,而且可凭借自己拥有的特色数据库资源,在激烈的资源建设竞争中取得一席之地,拓展自己的生存空间。

    特色数据库的具体形式有二次文献库、二次文献加全文库、全文库、网络资源导航库和多媒体库。目前的数据库绝大部分是书目文摘型的二次文献库,但建设二次文献库由于投入的人力、物力比较大,现在很多部委情报所都在弱化此项工作。院校图书馆、研究院所图书馆如果没有大量的投入,也不大可能继续建设二次文献库。利用全文数据库技术,通过仔细的分类标引,建立全文库可能是今后发展的一个方向。例如解放军军械工程学院建立的装备文献数据库,通过图书馆人员专业的分类标引,利用非结构化数据库技术快捷方便地建立起全文库和多媒体库,就具有很强的特色。

4 资源建设的重复性问题

    目前各单位的数字图书馆信息资源建设由于缺乏统一规划、组织和协调,大多处于各自独立、相对分散的状态,因此不可避免地出现了不同程度的信息资源重复建设问题。

    要避免数字图书馆信息资源建设出现重复建设问题,领导机关应在统一信息资源加工平台和标准的基础上,统一规划和协调,各图书馆从自己的特色信息资源做起,用统一的标准建设各具特色、有所分工的数字资源库,同时在统一经费管理调拨下,各图书馆利用联机联合编目建库系统,通过网络实现联合联机编目、联合建库,分工协作,实现信息资源的共建共享。

5 资源建设的质量控制问题

    信息资源的生命力主要在于能够提供服务的信息资源的数量和质量,而质量更是关键,因为它直接影响到信息资源共享的可实现性和有效性。光扩充数量、仅仅以占有信息资源为目的、没有合理的分类体系、不进行严格的编目控制和缺乏质量控制的信息资源建设,即使其信息资源再丰富也无异于一座堆放垃圾的仓库,分散无序的海量信息只会给利用者带来困扰和烦恼。

    另一方面,信息资源具有长期存储性,从十几年前到目前连续生产的二次文献数据库正是目前数字图书馆的重要基础;而根据经验,数据库即使有著录错误、标引错误等质量问题,修改数据库也是非常困难,因为发现错误的人往往是检索用户,他不能及时通报数据库维护人员;况且数据库容量一般都有几十兆甚至几百兆,备份数据、重新发布数据涉及到多个部门,往往导致将错就错,给资源的使用者造成很大的不便。因此,图书馆在进行信息资源建设时,必须注意信息资源建设的质量控制,尤其是在二次文献数据库建设时,更应该加强数据著录准确性和格式的标准性、数据标引、检索语言的规范性,从而为提高信息资源的查全率、查准率提供可靠保障。

6 资源建设的技术问题

    随着信息技术的飞速发展,目前针对信息资源建设的数字化加工技术、数据库技术、存储与检索技术已经基本成熟,很多厂商推出了相应的产品,应该说信息资源建设中的技术问题已经是一个不是问题的问题。在这里指出,主要是提醒各图书馆在进行信息资源建设时,在技术层面应“立足应用,以我为主”,提倡“拿来主义”,尽量引进成熟技术和产品或者与厂商合作建设,而不必单独自行开发,浪费大量的时间和人力、财力,因为图书馆的优势不在技术,而在对信息资源的组织、管理和利用,技术只是我们利用的工具而已。

    同时,随着技术的发展,很多成型的产品已经出现,尤其是软件系统,很多技术都是通用的,数字图书馆的需求也是共性的,只要在一个单位成功,就可以向其它单位进行推广。因此,在实际工作中,各图书馆应加强交流,注重成功应用案例的推广,技术并不是阻碍信息资源建设的主要原因。在信息资源建设工作中,笔者认为起主导作用的应该是对信息资源的收集、加工、组织和处理等业务工作熟悉和擅长的图情管理人员,信息资源建设必须是以业务为主,而不是以技术为主。

    当然,各图书馆在数字信息资源的建设过程中,还应注意转变观念、人才培养等问题,因为信息资源建设归根结底需要图书馆人员来完成,只有提高信息管理人员的素质,培养出精通多种技能的知识型图情人才,才能真正做好信息资源建设。


参考文献

1   勇等.加强文献数据库及检索刊物的质量控制.情报学报,1999(1)5053

2 郭振安等.网上信息资源重组的实践.中国信息导报,2002(7)

李勇 中国航天信息中心

高陆路 中国船舶工业综合技术经济研究院

邱祖斌 中国飞机发展研究中心