关于创建 “20世纪中国人物传记资料全文数据库”的构想
傅德华 于翠艳 李春博
(复旦大学历史系 上海 200433)
摘 要 本文主要探讨关于创建“20世纪中国人物传记资料全文数据库”的构想缘起、创建数据库的迫切性、数据库的内容、可能遇到的困难以及解决问题的对策等。
关键词 20世纪 传记资料 全文数据库
1 构想的缘起
1990年复旦大学历史系编纂的《辛亥以来人物传记资料索引》(以下简称《辛亥人物索引》)出版后,受到了中外学术界的广泛赞誉,很快销售一空。之后,应学术界再版的要求,以及满足学术界期盼能有一部查找整个20世纪的中国人物传记资料索引的工具书的需求,复旦大学历史系在《辛亥人物索引》的基础上,经过17年长期资料的积累,又着手编纂大部头的《20世纪中国人物传记资料索引》(以下简称《世纪人物索引》),该书书稿已交付出版社,预计年内即可问世。
《世纪人物索引》是在《辛亥人物索引》基础上编纂而成的,分为上、下两编,上编为原《辛亥人物索引》的修订重印,下编包括《辛亥人物索引》新增补的传记资料和《辛亥人物索引》向前向后共延伸61年的1万余人的传记资料。时限包含了从1900至1999年整整一个世纪的人物传记资料目录,共收人物近30000人,传记资料150000余条,约400余万字。它的编纂与出版,将为国内外学术界查检这一时期的人物传记资料提供极大的便利。《世纪人物索引》一书,将成为目前收录20世纪人物最多,传记资料信息量最大,涉及政治、经济、军事、文化等领域人物,而时间跨度最长的一本工具书,它的出版无疑将为20世纪中国人物的研究提供极大的帮助。
在《世纪人物索引》即将问世之际,有学者向本书编纂者提出能否创建“20世纪中国人物传记资料全文数据库”,从而为中外研究者提供更大的便利。我们在全面考虑了全文数据库给研究者带来的便利和可能遇到的困难之后,决心努力克服困难,利用现代化技术手段将所搜集的传记资料,通过扫描或翻拍,创建一个目前国内最具学术性、权威性的全文数据库,以满足研究者的需求。
2 创建全文数据库的迫切性
创建这样一个大型的检索百年中国人物传记资料的全文数据库的迫切性,主要表现在以下几个方面:
本全文数据库比《世纪人物索引》检索更为方便,可以大大节省读者的时间和精力。《世纪人物索引》为国内外学术界查检20世纪的人物传记资料提供的便利是毋庸置疑的。譬如要了解关于丁玲的研究情况,只要在上编笔画索引中检索到丁玲,那么在正文中就可以找到关于丁玲的传记资料有多达135种,此仅为1911至1986年间发表及出版的,在20世纪其余时间内出版的资料则可以在下编中检索到。读者据此去查找相关的资料,不仅非常便利,而且保证了对丁玲研究情况的全面了解。
不过,《世纪人物索引》只提供了人物传记资料的来源即线索,具体的每一种资料还需要读者再次去查检。而且《世纪人物索引》由于受上编《辛亥人物索引》修订再版的限制,同一个人物的资料索引,可能分散在上、下两编中,那么就需要两编都检索,检索起来有点麻烦。更令读者头痛的是在检索到相关的资料后,还需要一一地去寻找资料的全文,像关于丁玲的传记资料,上下两编共多达280条,要真的寻找到这些资料的全文,读者恐怕还要花费不少的时间和精力。而如建成全文数据库,则只要输入人名,那么关于该人物的所有传记资料都可以显示出来,点击其中的任何一篇,都可以直接链接到它的全文,这样通过简单的检索,就可以实现从篇目到全文的一次完成,可以极大地方便读者。这是其一。
创建全文数据库,更能保证读者研究的全面性和准确性。读者通过《世纪人物索引》可以检索到关于某人的相关传记资料,但不一定能查找到相关的资料全文,尤其是一些出版年代较早的报刊、港台的报刊和论文集,读者恐怕很难搜集齐全,如此便势必影响研究的全面性。而我们通过各种途径将这些资料搜集齐全,创建全文数据库,则既可以省去读者到处查找资料的烦恼,又可以保证读者对其所要研究的人物,掌握更全面、更准确的第一手资料。这是其二。
创建全文数据库,可以保证读者随时随地的查询。使用《世纪人物索引》,研究者必须到图书馆或资料室才能查询相关的资料,而我们将数据库建成后,放在复旦大学的网页上,那么复旦的师生无论是在图书馆还是在办公室、教室、寝室,都可以随时进行相关资料的查询。即使国内外的其他学者,只要登录互联网,都可以远距离进行查询,共同受益。这是其三。
学术界在评价一本工具书是否具有很高的学术性和权威性时,关键是看它是否具备独特的检索功能。正如学术大师梁启超在给梁廷灿编纂的《历代名人生卒年表》一书的“序言”中所言:“学术工具之书,愈便检阅则价值愈增。”
3 构想中的“20世纪中国人物传记资料全文数据库”
我们设想的“20世纪中国人物传记资料全文数据库”是在《世纪人物索引》基础上创建的,首先将《世纪人物索引》的全部内容以及索引中检索到的资料全文悉数扫描或翻拍,然后对其进行处理,制作成全文数据库。
《世纪人物索引》共收人物近30000人,传记资料150000余条,主要来源于1900至2000年我国出版的(含香港、台湾)的中文专著、论文集、报刊、年鉴、百科全书和文史资料等。其中报纸2000余种,论文集3500余种。我们设想将所有这些资料都制作成数据库,不仅可以检索到资料的来源,而且可以提供资料的全文数据,并可以检索到相关文献的详情,如报纸、期刊的创刊情况,对港台出版的报刊加以标注,或对所选中文专著、论文集、年鉴、百科全书等的出版情况等等,均注明作者、出版社及出版年月,一检即得。
《世纪人物索引》中所收的150000余条传记资料,有些是发表在1979年以后的期刊上的,其中不少可以在电子期刊中检索到,对于这部分资料,我们不打算花太多的精力再去重新扫描,而是直接进行转录,或是在我们的全文数据库中,对其加以超级链接。我们的重点是要放在那些没有电子版的,尤其是那些读者不容易查找到的资料上,如刊登在《民生报》(1927年5月11日创刊)、《正言报》(1940年9月20日创刊)等报纸上的文章,尤其是早期的报纸,读者要查找起来恐怕很困难。还有一些发表在1979年以前的《华北》(1906年创刊)、《暾社学谭》(1911年创刊)、《歌场新月》(1913年创刊)等期刊上的文章,也都不太容易找到,而更难查找的是《中国一周》(1950年创刊)、《中外杂志》(1967年创刊)、《山东文献》(1975年创刊)的港台早期出版的报刊。还有收录的几千种论文集,如莫洛编纂、商务印书馆1912年出版的《陨落的星辰》,由美人勃德等编、上海传记有限公司1925年出版的《中华今代名人传》,郑贞文撰、福建省政府教育厅1938年出版的《闽贤事略初稿》,包括那些由台湾和香港出版的《民国人物纪闻》、《太原五百完人》、《中共军人志》、《中国老一辈革命家》等。对于读者难以查找的这些资料,我们可以利用自身的有利条件,如与许多图书馆的友好关系,与港台学术研究机构,如台湾中央研究院近代史研究所和台湾大学及香港大学高校的交流关系等等,力争将它们搜集齐全,一览无遗。
在尽力将各种传记资料搜集齐全并扫描或翻拍后,我们设想利用相关的软件,使数据库能具有强大的检索功能,既有初级检索,又有高级检索,既有人物的人名检索,又有分类(不同学科或领域)检索、书名检索和著者检索。譬如既能通过初级检索中的传主人名的检索,查检到关于某个人物的所有传记资料,又可以通过高级检索,检索到某个著者关于这个人物的传记作品,还可以根据分类检索,检索到关于这个人物的不同类型的作品,同时还可以检索到引用的相关文献的详情。不仅能检索到全文,而且可以迅速查到所需的字、词、篇目、书名或著者资料,并可以随时跳转使用,另外还可以放大、缩小和复制、下载,或直接打印原文。
4 创建本资料全文数据库的困难及对策
“20世纪中国人物传记资料全文数据库”是一项工程浩大、成本较高、组织困难的艰巨工作。在组织建库过程中,可能会遇到各种各样的困难。
第一,150000余条传记资料,仅仅要搜集到这些资料原文,就要花费大量的时间和精力,而要将它们加以扫描或翻拍,制作成全文数据库,花费的时间和精力更是不言而喻的。很多资料可能还需要到外地去查找,有文献传递的还好,没有文献传递的,恐怕还要我们亲自去查找。这其中的难处,恐怕也只有做起来了,才能真正体会到。而对资料全文的扫描,需要有资金的支持;制作全文数据库,需要有过硬的软件和硬件,也需要资金的支持。对于这些困难,我们希望能够得到相关单位的支持,能保证我们顺利地将资料搜集齐全。同时,我们也希望能够争取到相关的课题科研经费,保证有足够的资金来创建这个全文数据库。
第二,数据库在制作过程中,可能会遇到版权方面的问题。《世纪人物索引》是由我们复旦大学历史系编纂的,在这方面不存在版权问题。但有些传记资料全文的扫描,可能就要牵扯到版权问题,还需要去协调解决。当然,我们制作数据库的目的,是为读者提供更大的便利,为了更好地促进20世纪的中国人物研究,而不是商业盈利目的。这也许会有利于问题的解决。
第三,我们希望中国索引学会的会员及单位,凡有兴趣者参与共同开发。
第四,制作这个全文数据库,对软件的要求比较高,仅靠我们系里自身的条件,恐怕无法独立完成,我们希望能够与优秀的软件公司合作,共同开发这个数据库,使数据库能做到方便、快捷的检索,从而使这个数据库真正成为20世纪中国人物研究的最得力助手。
对于建库过程中可能出现的这些困难,我们将想方设法去克服它们,争取使各种问题得到圆满解决,从而保证这个“20世纪中国人物传记资料全文数据库”能成为一个具有学术性和权威性的最完善的数据库。
创建“20世纪中国人物传记资料全文数据库”还只是一个初步的构想,有些想法可能还不太成熟,还需要在组织建库的过程中不断地探索。但我们坚信,本数据库一旦开发成功,对于中外的学术界以及所有研究中国人物传记的学者来说,将是一件受益无穷的大好事,且对于推动中国人物传记研究的大繁荣和大发展也是很有�益的。
傅德华 教授,复旦大学历史系工作。中国索引学会常务理事。
于翠艳 馆员,复旦大学历史系资料室工作。
李春博 博士,复旦大学历史系资料室工作。