从“引得”到“全文检索”——谈《文渊阁四库全书》(全文网络版) 刘 蔷
发布时间:2018-09-27  浏览次数:63

从“引得”到“全文检索”

——谈《文渊阁四库全书》(全文网络版)

  蔷

(清华大学科学技术史暨古文献研究所  北京 100084)

       引得,即现在通称的“索引”,由英文index一词而来,为二十世纪二十年代洪业先生所译,颇得音义兼顾之妙。为书籍编制索引的做法是西方近代学术的科学方法之一,是提高读书和治学效率的重要手段。洪业先生曾道:“引得者,予学者以游翔于载籍中之舟车也。舟车愈善,则其所游愈广,所入愈深”,评价其功用十分精当。

中国的典籍异常丰富,过去的读书人讲究博闻强记,但能够将书籍烂熟于胸的人毕竟是少数,绝大多数人只能靠翻检目录或凭记忆线索查找书籍中的具体内容,常常是费时费神,徒劳无功。而索引可以免去学人反复检读的辛劳,是所谓“治学之利器”,不仅嘉惠士林,也为中国传统典籍的研究开创了新方法和新局面。

       中国的引得之学,至迟可以上溯到明清时期,如《洪武正韵玉键》、《史姓韵编》等书的体例,便类似检索工具书的编排,但数量非常之少。相对于古典目录学的发达,索引学发展的不足很是突出,姚名达在《中国目录学史》中就说“我国古代目录学之最大特色之重分类而轻编目,有解题而无引得”,以至于陈垣先生慨叹我国“有长远的历史,丰富的史料,而无详细的索引”,认为是“中国的四大怪事”之一。二十世纪初,在清末西学东渐的背景下,中国学术界渐渐重视编制索引和利用索引。二十年代开始的索引运动,提倡科学的读书治学方法,用西方的办法来整理国故,胡适、林语堂、赵元任、刘半农、袁同礼等都大力提倡索引的编制,对传统史料典籍进行科学化的整理,使之成为学术研究的工具。其中尤以1929年建立的哈佛燕京学社引得编纂处的成绩最多,在洪业先生的主持下,共编制了64种古籍引得,对学术界的贡献可谓善莫大焉。洪业还在《引得说》一书中,总结中国典籍索引的编制方法,探讨索引学的理论意义。

       编制索引,是一种学术性兼技术性的工作,看似容易而实不容易,编制者既要有丰富的典籍知识,又要耐心细致,抱定“苦我一人,而利天下人”的信念,其间甘苦,不谙熟其事者是不能知的,被称作是“为人之学”(洪业语)。分析标引出有检索意义之词,全靠索引编制者自身的学术功力,然而标引者往往因个人取舍而影响到整个索引的学术质量,因此要想不漏掉一切有检索意义的字词、满足所有的检索需要,编制逐字索引也就是后来通称的全文索引,才是最可靠、最全面的办法。从上世纪二十年代直到八十年代,限于手工作业的耗时、耗力、耗人,全文检索只能成为一个编制索引的理想目标,应用到卷帙浩繁的传统典籍上,实在令人不敢想象了。

       现代计算机技术的引入,为索引的编制开辟了一片无限广阔的新天地。八十年代初,我国传统典籍的计算机化研制开始起步,建立了一些经典著作的数据库检索系统,如四川大学古籍研究所开发的《全宋文》资料检索系统、中国社会科学院开发的《全唐诗》、《先秦两汉魏晋南北朝诗》、《全上古三代秦汉三国六朝文》、《全唐文》等“中国古典文献计算机数据库系统”以及《十三经》检索系统等,也出现了针对一部书或几部书所做的全文索引,如深圳大学开发的《红楼梦》全文数据库、哈尔滨师范大学制作的《史记》全文检索系统、台湾中央研究院历史语言研究所开发的《廿五史全文资料库》等等。九十年代以后计算机与网络技术迅猛发展,数据库检索系统的编制更为广泛,而其中规模最大、技术上有重要突破且广受赞誉的则是世纪之交面市的《文渊阁四库全书》电子版。

       《四库全书》是中国古代、乃至世界范围最大的一部丛书。收录3461种图书,抄成36000余册230万页,囊括了从先秦到清代乾隆以前的主要典籍,涵盖了中国传统学术文化的各个学科领域。其内容宏富令人叹为观止,从问世至今,还没有一个人能够从头到尾读完这8亿字的鸿篇巨著。遍读《四库全书》,意味着涉猎中国古代所有的学问,穷尽中国博大丰富的传统文化,这对任何个人而言,都是难以企及的。何况,一个人即便能够通读全书,也不可能做到随心所欲地检索,更不能在很短的时间内、化费很少的精力,从浩如烟海的《四库全书》中将相关材料全部钩稽出来,这在过去的读书人看来,是绝难做到的。

       所幸,运用现代信息处理技术,1999年,经过近三年的努力,由香港迪志公司出资、北京书同文公司研制、上海人民出版社发行了《四库全书》电子版,先是全文光盘版,而后2000年发行了全文网络版。在保持原书真迹的基础上,首次实现了书名、作者、类目、标题、年代以至全文中的字、词、语等多途径的检索,为读者提供了以往难以想象的更广泛、更深入、更卓有成效的古籍研读与整理的快捷方式。此外它还是跨平台使用的电子出版物,可以在中文简繁体、英文、日文、朝鲜文等多种视窗环境阅读,为中华珍贵书籍的保存和最大限度的利用及最广范围的流传提供了极大便利。

       过去士人查阅《四库全书》,一般程序为:先通过《总目》找到某种书,再查一书之目次,据目次顺序翻阅书中内容。对于电子版《四库全书》的读者来说,不仅可以在瞬间查到所要图书,而且可以直接深入文献中查到局部,由表及里、由此及彼。不仅如此,还可以在几秒至十几秒内,将《四库全书》洋洋3400余部书籍中的相关材料一并找到,而且查找结果精准无疑。这样的统计和整理,无疑极大启发与扩展了学者研究的广度与深度,有助于学者开辟更多更广的专题研究。

从索引学角度看,《四库全书》电子版又兼具传统的专书引得、人物引得、书目引得和篇目引得等多种类型;从检索功能看,《四库全书》电子版又兼含逐字引得和字词引得。这种强大的索引功能,能帮助我们对于传统典籍也能进行深入细致的分析,其作用较之前人的“记诵之学”,似不逊色。

       将纸质书籍电子化、数字化,是未来图书出版的大趋势,计算机和网络技术的普及,也为索引学理论应用于数字图书制作拓展了巨大空间。《文渊阁四库全书》(全文网络版)的成功开发,为大规模古代文献如何编制全文索引提供了一个可资借鉴的理想模式;借助网络传播,还扩大了读者群,传统文化在信息时代的研究和推广变得容易起来,索引运动时代提出的“要使人人能用古书”的目标也将得以实现。“于学术界之贡献极大,既已风行海内外,承学之士,苟非安于抱瓮而汲之愚者,咸利其便而重其书,诚学林之宏举,不朽之盛业”(洪业语)。然而,除了凭借新的技术手段以外,索引工作者甘为他人案头工具、“为人之学”的精神,却和洪业等前辈学人所倡导毫无二致,这是最令人击节赞叹的。

  蔷  清华大学科学技术史暨古文献研究所副研究员。