我国图书馆事实型数据库资源现状的分析与评价
张 敏
(复旦大学图书馆 上海 200433)
摘 要 数据库是图书馆最主要的电子资源。与文献型数据库一样,事实型数据库也应该是图书馆数据库资源的一部分。本文通过对图书馆的调查统计,分析了我国图书馆事实型数据库资源的现状与存在的问题,同时对如何评价事实型数据库提出了自己的观点。
关键词 事实型数据库 电子资源 现状分析 评价
数据库是通过数据库技术将文献信息、事实数据、网络资源进行组织和管理,形成各种各样的数据总汇,这些数据库已经成为现代图书馆最主要的资源之一。数据库不仅丰富了图书馆的信息资源,而且为图书馆开展深层次信息服务提供支持。
1 数据库及其分类
所谓数据库,是指长期存储在计算机存储设备上的、可供计算机快速检索的、有组织的、可共享的数据集合[1]。目前,对数据库的分类并没有统一的标准,20世纪80年代,Carlos Cuadray曾提出将数据库分为参考数据库和源数据库。参考数据库是指文献目录型数据库和指示型数据库,主要为用户提供查找源文献或事实的线索。源数据库是指数值型数据库、文本-数值型数据库、全文型数据库和软件型数据库,主要为用户提供原始信息,满足用户最终的信息需求[2]。
也有学者从文献学的角度提出将数据库分为文献型数据库、事实型数据库、数值型数据库等[3]。在上述类型中,事实型数据库和数值型数据库往往难以明确划分,所以有些学者主张把两者合并,称“事实数值数据库”,或将数值数据库纳入事实数据库之中。
笔者认为数据库从内容上划分,分为文献型数据库和事实型数据库比较合适。文献型数据库,包括目录文摘型文献数据库、全文型文献数据库。这类数据库的学术性比较强,是科学研究成果的集合,是科研工作者进一步开展科研的基础;事实型数据库,包括数值数据库、知识数据库、法律法规数据库、新闻报道数据库、名录数据库、图像数据库、多媒体数据库、软件数据库等。这类数据库专业性、时效性、应用性比较强,可以为科研工作提供支持、也可以为日常生活提供便利。
2 图书馆事实型数据库的资源现状分析
随着信息技术的不断发展和应用,图书馆的资源已不仅仅是传统的纸质文献,大量的电子资源,例如:网络数据库、光盘数据库、电子期刊、电子图书,已经成为了图书馆资源建设的重点之一。以复旦大学图书馆为例,最近3年(2002-2004)复旦大学图书馆在总购书经费不断增加的基础上,用于购买电子资源的经费占总购书经费的比例逐年递增,分别为14%、16%、20%。
目前,我国图书馆的数据库以文献型数据库为主,事实型数据库在电子资源中的比例明显要低于文献型数据库。笔者首先调查了一些国内大型的、数据库丰富的图书馆,对其数据库的构成进行了分析,见下表[4]:
图书馆 | 数据库总量(个) | 文献型(个) | 事实型(个) | 事实型数据库在数据库中的比例(%) |
国家图书馆 | 86 | 54 | 32 | 37% |
上海图书馆 | 110 | 80 | 30 | 27% |
北京大学图书馆 | 221 | 161 | 60 | 27% |
清华大学图书馆 | 275 | 230 | 45 | 16% |
复旦大学图书馆 | 167 | 141 | 26 | 16% |
需要指出的是,笔者在调查中发现有一些数据库既收录事实数据、实时新闻,同时也收录一种或几种期刊的文摘或全文,例如:ProQuest Asian Business(亚洲商业数据库),既收录最新的有关亚洲商业和经济信息,也收录包括Far EasternEconomic Review(远东经济评论)、Asiaweek(亚洲周刊)等重要的国际性刊物。这类数据库已经很难严格区分是文献型数据库还是事实型数据库,但是应该可以根据其收录的主要内容或重要特色来划分其类型。笔者将ProQuestAsian Business(亚洲商业数据库)归为事实型数据库。
同时,笔者也调查了一些国外的大型图书馆,例如:哈佛大学图书馆数据库总量为493个,其中事实型数据库198个,事实型数据库的比例达到了40%[5];新加坡国立大学图书馆数据库总量600个,其中事实型数据库148个,事实型数据库的比例达到了25%[6]。总体而言,国外图书馆拥有事实型数据库的绝对数量和相对数量都要多于国内图书馆。通过调查,笔者总结了我国图书馆事实型数据库资源建设的现状:
(1) 图书馆文献型数据库多于事实型数据库。主要原因有:一、数据库商开发的文献型数据库产品较多;二、文献型数据库的内容稳定、规范、学术性强;三、科研工作者使用文献型数据库的频率较高。同时,事实型数据库本身也存在着问题,例如:事实型数据库开发较难、产品质量良莠不齐。一些事实型数据库更新不及时、数据连贯性差、准确性差、收录不够全面等等,这些问题都有可能制约事实型数据库的实用性。
(2) 事实型数据库的专业性较强。事实型数据库收录的内容一般不可能涵盖所有专业,往往是某一个专业、某一个行业,甚至某一个更小领域的相关信息。例如:各种各样的商情数据库、行业或地区企业名录、法律法规数据库、医药数据库等等。事实型数据库应该具有某一个领域的百科全书的功能,所以事实型数据库应该避免面面俱到,要有重点、有特色。图书馆往往也根据主要服务对象的专业来选择订购事实型数据库。
(3) 事实型数据库的质量有待提高。事实型数据库的质量一方面在于收录的内容,另一方面在于检索的平台。事实型数据库的内容形式多样,有统计数据、企业名录、新闻报道等,如何将它们有序地组织起来,并且为用户提供方便的检索平台,是事实型数据库质量的关键。目前,我国图书馆有一部分事实型数据库是由国内数据库商开发的,这些数据库重点收集我国相关行业的信息、数据、分析报告,在内容上具有一定的特色。但往往由于数据库更新不及时、数据不连贯、检索点单一等原因使其内容上的特色不能很好地体现。
(4) 事实型数据库的相关版权问题。通常情况下,文献型数据库的开发只要获得收录期刊、图书、论文等的版权人许可并支付一定报酬就可以了。但事实型数据库的版权问题就复杂很多。一方面,事实型数据库的内容丰富、种类繁多、信息来源广泛。要妥善解决数据库收录的依法授权问题,可能要涉及很多权利人,例如:期刊杂志社、新闻媒体、科研院所、各行业统计机构、个体著作权人等等。另外,如何判断哪些内容需要授权,哪些内容不需要授权,也是数据库收录中应该重视的问题。另一方面,事实型数据库的很多内容本身是不构成版权保护的,例如:各种公开的政府统计数据、经济报告等。这些信息的收集和组织过程中开发者投入了大量的成本,如何保护开发者的利益,这也是事实型数据库开发者最关心的版权问题。目前,我国著作权法第十四条规定:“汇编若干作品、作品的片段或者不构成作品的数据或者其他材料,对其内容的选择或者编排体现独创性的作品,为汇编作品,其著作权由汇编人享有,但行使著作权时,不得侵犯原作品的著作权。”[7]
3 图书馆事实型数据库的评价
随着图书馆采购电子资源的数量不断增加,如何对电子资源进行选择、评价,已经成为图书馆界普遍关注的话题和研究热点。笔者阅读了一些国内相关的文献后发现,在图书馆电子资源评价的研究中,学者们比较重视对文献型数据库的评价研究,一些学者对电子资源的评价提出了合理、科学的评价体系,规范了具体的评价指标[8]。但这些评价指标是否完全适用于对事实型数据库的评价呢?笔者认为并不能完全适用。当然,也绝不是完全否定前人的研究,只是考虑事实型数据库在内容和形式上的特点,在评价事实型数据库时应该特别注意以下几点:
(1) 内容评价
内容的权威性和准确性。这是内容评价的重点。事实型数据库通常收录统计数据、分析报告、化学反应式、基因图谱、名录等信息。信息的来源应该具有权威性和准确性,只有这样数据库的学术性才强、价值才高。
内容的范围和深度。事实型数据库不可能包罗万象,但在其收录范围内的信息应该尽可能全面,并保证一定的深度。
以一个较成功的事实型数据库――OSIRIS(全球上市公司分析库)为例。该数据库是欧洲著名电子商业信息出版商―BvD公司与全球若干经济类权威机构联合开发的“BvD全球金融与各国宏观经济指标专业分析库”中的一个子库。在收录范围方面,截止2004年11月,OSIRIS收录了24700家上市公司,基本涵盖了全球所有的上市公司,这点可以在中国上市公司的数量上得到验证:OSIRIS收录了内地1310家上市公司。据中国证监会统计资料显示,截止2004年11月,境内上市公司数为1377家[9],OSIRIS收录比例达到95%。在收录深度方面,OSIRIS收录的数据包含各上市公司历年资产负债表、损益表、现金流量表及各项财务分析比率,完善的公司信用评级数据,详细的股份与股票分析指标,相关路透新闻(并购与经营类报道),详细的股东信息及持股比例结构等信息[10]。
内容的连贯性和及时性。事实型数据库的内容,特别是一些统计数据、分析报表,应该保持连贯,这样才便于检索者对数据进行比较、分析,才能够真正体现其对科研工作的参考价值。另外,事实型数据库的更新应该比文献型数据库更及时,因为事实信息瞬息万变,往往最新的信息价值最大,这就要求事实型数据库尽可能地缩短更新周期,为用户提供最及时的信息。OSIRIS是每周更新,基本能够做到为用户及时提供全球上市公司的信息。
(2) 系统功能与检索评价
具有特色的检索途径。文献型数据库的内容格式统一、著录规范,通过题名、作者、期刊名(出处)、机构等途径基本上就能够准确定位某篇文献,所以各种文献型数据库的检索途径都比较相似。事实型数据库由于收录内容形式多样,为了方便用户检索,应该根据内容提供具有特色的检索途径,例如:OSIRIS数据库就提供了公司名称、公司地理位置、所属产业、股东、员工数等富有特色的检索途径。
系统分析功能。文献型数据库的结果不论是题录、文摘还是全文,基本上已经能够满足用户的检索需求。而事实型数据库的检索结果是用户开展进一步分析的依据,好的事实型数据库应该能够进一步提供分析功能,代替或者帮助用户进行分析。仍然以OSIRIS为例,该数据库具有同业组分析、统计、制图等功能,可支持证券投资分析、跨国企业财务分析、上市公司信用分析、各国公司的转让价格等研究。
综合而言,事实型数据库的评价应该更加灵活,根据其内容特征来选择评价重点,构建评价指标体系。
参考文献
1 叶继元著.信息检索导论.北京:电子工业出版社,2003:125
2 蔡绍莹.事实型数据库初探.情报学报.1990(5):360-370
3 何玮,雷春炳.医学专题事实型数据库的探讨.中华医学图书情报杂志,2002(2):3-6
4 国家图书馆:http://www.nlc.gov.cn/(2005-3-17)
上海图书馆:http://www.library.sh.cn/(2005-3-17)
北京大学图书馆:http://www.lib.pku.edu.cn/(2005-3-17)
清华大学图书馆:http://www.lib.pku.edu.cn/(2005-3-17)
复旦大学图书馆:http://www.library.fudan.edu.cn/(2005-3-17)
5 哈佛大学图书馆:http://hul.harvard.edu/(2005-3-17)
6 新加坡国立大学图书馆:http://www.lib.nus.edu.sg/(2005-3-17)
7 http://www.bjinfobank.com/IrisBin/Select.dll?Special?db:FL(中国资讯行―中国法律法规库)(2005-3-21)
8 肖珑,张宇红.电子资源评价指标体系的建立初探.大学图书馆学报,2002.3:34-55
9 中国证券监督管理委员会
(http://www.csrc.gov.cn/cn/statinfo/index.jsp?path=POOT%3E%CD%B3%BC%C6%D0%C5%CF%A2)(2005-3-20)
10 http://www.bvdep.com/(2005-3-17)
张 敏 硕士,复旦大学图书馆参考咨询部工作。已发表论文5篇。