关于“中国丛书书目数据库”的制作
于翠艳
(复旦大学图书馆 上海 200433)
摘 要 《中国丛书综录》是20世纪以来最具影响的大型古籍检索工具书之一。本文以《中国丛书综录》为基础,就“中国丛书书目数据库”的制作�制作中的问题及数据库的完善等,作了初步的探讨。
关键词 丛书 《中国丛书综录》 “中国丛书书目数据库”
中国古籍“浩如烟海”,丛书是其中最大的部类。从其著录内容来看,历代各类重要著述,大都已收录在丛书中。古籍丛书是研究我国古代文化的重要资料来源。
关于我国古籍的种数,长期以来,有“不下五、六万种”、“估计为八到十万种”、“估计为十五万种”、“总数在二十万种以上”等多种说法。古籍种数繁多,毋庸置疑,而古籍中的相当一部分,都可以在丛书中找到。不过,要在浩瀚的丛书中找到我们所需要的书籍,必须借助于丛书目录,否则无从下手。清代以来,前人编纂的各种丛书目录,有二三十种之多,因其中不少内容重复,要将这些丛书目录做成一个丛书书目数据库既不现实,也没有必要。而建立一个以《中国丛书综录》为基础、并增补其他内容的“中国丛书书目数据库”,则是完全可能的。因为在现有的丛书目录中,最完备的一部,即编纂于20世纪50年代末的《中国丛书综录》(下简称《综录》)。《综录》所含丛书子目,除去重复,达38891种之多。按古籍“总数在二十万种以上”的说法,《综录》所收古籍已占到了七分之一以上;而按“五�六万种”的说法,其所收古籍甚至达到一半以上。由此可见,利用《综录》,可以找到古籍中很大一部分。因此,我们设想建立一个以《中国丛书综录》为基础并增补其他内容的“中国丛书书目数据库”。
1 “中国丛书书目数据库”的制作理由
《综录》经过近半个世纪的检验,已经以其搜罗宏富、著录详明、分类得当、检索便捷等优点,赢得了海内外学者的普遍青睐,成为20世纪以来最具影响的大型古籍检索工具书之一,被誉为“探索古籍的雷达”。关于《综录》的利用及其优点,正如《〈中国丛书综录〉的文化信息价值探求》一文所说,“读者无论从丛书书名、子书目名、子书目作者以及子书目的下落等任何角度,都可以得心应手地去检索。此外,通过第二册《子目分类索引》,可以得知某一专题或某一学科在丛书中有些什么书籍,起到了专题目录或学科目录的作用。而查它的《子目著者索引》,则又可以得知某一著者有些什么著述放在丛书里,起到了著者目录的作用”。《综录》的优点,在此表述得很全面。
在手工检索时代,纸本的《综录》确实可以让人得心应手地完成古籍检索。如读者要求了解书名《主一集》的作者,及其该书收在哪部丛书中。我们首先可以翻检《综录》第三册即《子目书名索引》,就可得知《主一集》收录在第二册《子目分类目录》1323页左栏。然后据此翻检第二册,并得知《主一集》的作者为明朝的吴志淳,该书收在《元诗选・二集》的辛集中。如果要进一步了解《元诗选》的编辑者、刊印的时间、刊行者以及其收藏所在,则翻检《综录》第一册《丛书书名索引》,找到《主一集》后面标示的两个数字:847和2276,根据第一个数字,在《总目分类目录》第847页中,可以找到《元诗选》,并了解该书为清顾嗣立所编辑,其版本为“清康熙中长洲顾氏秀野草堂刊本”,其书分三次刻成,《初集》刻于康熙三十三年(1694),《二集》刻于康熙四十一年(1702),《三集》刻于康熙五十九年(1720)。《主一集》即收在《二集》的辛集中。又根据上述第二个数字,再翻到《全国主要图书馆收藏情况表》的第2276条,可以知道北京图书馆(今国家图书馆)等26家图书馆藏有《元诗选》(其中南京大学和武汉大学图书馆所藏为残本)等收藏信息。
对于《综录》的作用,陈秉仁《〈中国丛书综录〉对中国古籍目录索引的贡献》一文指出,“读者从丛书分类、丛书书名、子目分类、子目书名、子目著者、收藏单位任何一个方面,都可以检索到所需要的丛书资料,一索即得,最大发挥了检索工具书的作用”。
在手工检索时代,《综录》确实为读者提供了很大的方便。不过,相对于计算机检索来说,手工检索仍存在不便。如《综录》使用四角号码排检,对于不太熟悉四角号码的读者,检索也存在困难。如完成上述书目检索,先要查明相关检索词的四角号码,才能在子目书名或著者索引中作检索。查到丛书出处后,又要查得丛书名的四角号码,然后到丛书书名索引中作检索。如果一种书收录于若干种丛书,则要分别检索多次,才能掌握全部信息。对于初学者而言,确实存在一定难度。
如果利用计算机技术制作“中国丛书书目数据库”,既能完整保留《综录》等所包含的书目信息,又可帮助读者更加简捷地检索到所需内容。依据古籍书目数据库制作经验,在最常使用的书名检索和著者姓名检索字段,除设置供读者选择使用的繁体及简体检索途径外,还可设置“首拼检索”功能。“首拼检索”法,即将所要检索的内容中每个字的首个拼音字母输入,就可以检索到所需内容,方便快捷。利用“首拼检索”功能,读者可以通过丛书书名、子目书名、著者姓名等途径进行检索,只要将查询关键词的每字首个拼音字母输入,就可以检索到首个拼音字母相同的若干部书,从中快速地检出所需的丛书,并同时了解该丛书的版本、撰辑者、馆藏地以及丛书子目在丛书中的位置等。
其次,建立“中国丛书书目数据库”,可以为那些手头没有纸本《综录》等的读者提供新的检索工具。《综录》已经有二十多年没有重新出版,很多需要查询的读者可能找不到纸本,而数据库的建立,则可以随时满足他们的查询需要。同时,利用局域网、互联网,可以更大程度地发挥“数据库”的工具书作用。如将该数据库放在复旦大学的网页上,那么复旦的师生无论是在图书馆还是在教室、寝室,都可以进行古籍丛书的查询了。和复旦大学联网的单位,也可以远距离进行查询,共同受益。
再次,“中国丛书书目数据库”可以为读者提供更多的检索方法和途径。纸本《综录》使用的是四角号码检索法,有丛书分类、丛书书名、子目分类、子目书名、子目著者等检索途径,而现在不少年轻读者对四角号码检索法不太熟悉,需要先熟悉四角号码,比较麻烦。制作“数据库”时,我们考虑,既保留四角号码检索法,又增加繁体检索、简体检索以及首拼检索法。检索途径除了保留原有的丛书分类、丛书书名、子目分类、子目书名、子目著者等,又考虑增加丛书版本、丛书编撰者以及收藏单位等检索途径,以满足读者多方面的需要。
基于以上的考虑,我们决定建立以《综录》为基础的“中国丛书书目数据库”,以求为读者提供更加方便、快捷的服务。而在制作过程中,我们发现建立数据库的意义还不止于此,利用数据库的功能,还可以对丛书本身做进一步的调查和分析,如统计某一朝代刊刻丛书的数量以及稿本、抄本的数量等等。
2 “中国丛书书目数据库”制作中遇到的问题
“中国丛书书目数据库”可以为读者提供极大的方便,这种方便的实现,建立在我们建库的大量工作之上。如《综录》所含丛书有2797种,需要对丛书名、辑撰者、版本一一输入,并标明每个版本的收藏单位。接下来,需要输入的丛书子目多达七万多种。这个工作量是非常大的。
其次,在制作过程中,关于数据库中的用字,有不少需要注意的地方:
(1)丛书名、丛书子目以及辑撰者的用字中,很多为非常用字,需要一一查阅,以保证所用字为纸本《综录》中的原字。有时查了字典,找到了该字,但在字库中找不到。有时根本查不到该字,这样给我们的处理带来了很大的麻烦。
(2)纸本《综录》中的用字,有不少异体字,需要特别注意。如“游”和“�”、“注”和“�”、“稿”和“藁”、“�”等。
(3)对于历代帝王撰辑的书目,我们还在皇帝的庙号之后加上姓名,以便读者的检索。如“清圣祖撰”、“清高宗撰”,我们都做成“(清)圣祖玄烨撰”、“(清)高宗弘历撰”。
(4)在输入姓氏时,还要注意有些字是当简不繁的,如“范”、“余”、“郁”等。此外,像“单”、“仇”等,按姓氏应读作“shan”和“qiu”,而不能输入常用的“dan”和“chou”,否则在首拼转换和查询时就会出错。
以上四点,是我们在制作“中国丛书书目数据库”时遇到的问题,也是一般的古籍数据库制作中通常会遇到的问题,需要特别注意。
《综录》由上海图书馆等数十家图书馆合作编纂,并由中华书局上海编辑所于1959年出版。此后,上海图书馆对《综录》做了一定的修改,如将收藏单位由41家增加到47家,由上海古籍出版社在1986年再版。在制作数据库过程中,我们将两个版本进行了对照,发现再版所做的修改之处主要有以下几种:(1)对丛书版本进行了修改,(2)对子目作了修改或增删,(3)修改了作者或作者的朝代,对原书的误题加以更定,但仍注明“误题”。尽管《综录》再版做了一定修改,但其中还是难免有错误或遗漏,为此阳海清编撰了《中国丛书综录补正》一书,对《综录》进行补充、修订。另外,施廷镛的《中国丛书综录续编》和阳海清的《中国丛书广录》,对《综录》也有一定的补充。因此,我们设想建立的“中国丛书书目数据库”,将把可增补《综录》内容都加进去,以便为读者提供更多�更准确的信息。
3 关于“中国丛书书目数据库”的设想
“中国丛书书目数据库”现还在第一步“《综录》数据库”的制作过程中,对于已发现的不足之处,我们希望能不断地加以完善。关于“中国丛书书目数据库”,我们有以下设想:
第一,数据库可以多角度、多方面地进行检索。数据库可以提供丛书分类、丛书书名、子目书名�子目分类、子目著者�版本以及收藏单位等多种检索途径,其中又各有首拼、繁体、简体等检索方法,以满足不同读者的需要。对于《综录》中有不同著录的丛书、丛书子目以及辑撰者,我们都分别做了数据,以保证两者都可以查到。此外,上海图书馆在听取读者使用意见的基础上,对《综录》又做了一定的修改,并增加了“丛书编撰者索引”,已于今年再次出版。因此,我们也会考虑读者的需要,增加丛书编撰者检索。
第二,为了方便读者,我们设想将本馆所藏丛书的索书号加进数据库。这样就可以利用“中国丛书书目数据库”,一次完成对本馆丛书资料的查询。对于本馆没有收藏的丛书,还考虑将几个主要图书馆的索书号加进去。
第三,对有影印本的丛书加以标注。《综录》中收录的部分丛书有影印本,对本馆有收藏的,我们都加以标注,这样,一方面可以使一些没必要看原本的读者,先利用影印本,从而保护古籍原本;另一方面,又可以弥补本馆原本收藏不足的缺憾,让读者不必舍近求远地去看原本。
第四,“中国丛书书目数据库”以《中国丛书综录》为基础,并将阳海清的《中国丛书综录补正》和《中国丛书广录》以及施廷镛的《中国丛书综录续编》中可增补《综录》内容都加入。同时,我们还考虑将现代出版的一些影印本丛书加入数据库,如《续修四库全书》、《四库全书存目丛书》、《四库未收书辑刊》等,这样就可以建立一个囊括更多古籍丛书的“中国丛书书目数据库”。“中国丛书书目数据库”的建立,无疑将是研究、整理和使用古籍的读者的一个福音。
以上关于编制“中国丛书书目数据库”的几点设想,还不太成熟,今后我们会进一步完善,希望这个数据库能成为研究中国古代文化的重要工具,成为“探索古籍的雷达”。
参考文献
1 上海图书馆编.中国丛书综录.上海:中华书局上海编辑所,1959
2 上海图书馆编.中国丛书综录.上海:上海古籍出版社,1986
3 刘尚恒著.古籍丛书概说.上海古籍出版社,1989
4 杨丽霞.《中国丛书综录》的文化信息价值探求.黑龙江高教研究,2005(5)
5 陈秉仁.《中国丛书综录》对中国古籍目录索引的贡献.中国索引,2005(3)
于翠艳 女,1971年生,复旦大学图书馆古籍部助理馆员。