关于“古籍电子定本工程”方案 尹小林
发布时间:2018-09-25  浏览次数:10

关于“古籍电子定本工程”方案

尹小林

(国学网站  北京 100037

一、定义

“古籍电子定本工程”系针对目前互联网流通的古典文献电子版本颇多讹误,虽查询便捷却往往不足征引的弊端,动员多方力量,经过不断努力,于2005年启动,尽量消除古代典籍在电子化过程中的各种差错,最终可实现古籍电子化的“零差错率”的软件工程。

凡隶属于该工程的电子产品,均将依据严谨的校勘标准和严格的出品程序制作,能以“水明沙净”的优质电子文本奉献于读者,做到让读者及研究人员放心引用,而不必再去复查第一手资料。

该工程旨在为大家提供质量可靠、使用便捷的国学经典文本,以期将传统的人文社会科学的研究推广与现代传播技术结合在一起。进而为中华文化的传承作出应有贡献。

二、缘起背景

1、古籍数字化或电子化兴起于上个世纪90年代,当时仅限于电子文本阅读,随着信息技术的迅猛发展,至今已有一万多种古籍实现了电子化,为人们利用古籍提供了极大的便利,古籍数字化已经成为必然之势。通过古籍原典、历朝历代整理成果数字化,形成一个庞大精深的立体知识体系,使数据库建设成为连续性、开放式、与文化传承和学术研究息息相关的一项工作,可以实现海量信息查询、字词频分析,用字量统计等古人难以实现的功能,为学术研究拓展了一片新的领域。建设大型古籍文献数据库,提供贴近现代学术的典籍资源,推进传统文化的现代化进程,为学术研究提供新的动力。

2、在古籍数字化欣欣向荣,为人们阅读研究提供诸多好处与便利的同时,我们也不难看到,与之相伴滋生了一系列新的问题,其中尤为突出地表现在数据内容、质量等方面,有些数字化资源随意节选,以讹传讹,产生了对读者的误导,给研究人员的参考使用带来很大的阻碍,加之部分数字化不注意传统文化的选择,为迎合部分读者,选取古籍中的糟粕,产生很大的不良社会影响,可见古籍数字化出版市场亟需进行规范指导。

“古籍电子定本工程”的实施与启动,将对提高古籍电子出版物的质量,使古籍数字化出版传播市场不断走向规范化,对古籍数字化的建设与传播具有很重要意义和产生很大影响。

三、必要性和可行性

1、古籍数字化不是简单的数字化技术问题,而是关系到中华数千年文明典籍的转化、再生、存续,关系到民族文化记忆、思想和现代化表述。当今社会,大量的研究者正翘首期盼着现代化技术带来尽可能多的典籍使用的便捷化、快速化的同时,更期盼古籍电子版内容的准确化。古籍数字化,应该尽量满足现代研究者的学术需要。做好古籍数字化,不是一个人几个人的事情,也不是一个小团体的事情,它关系到整个国学、整个民族。

2、在当前的古籍数字化发展欣欣向荣的同时,我们也应看到这一领域整体缺乏规范引导,质量参差不齐,良莠混杂,或错漏百出,或以讹传讹,或断章删节,割裂经典,或淫搜秽采,滥取糟粕,不但误导读者,也给研究人员的使用带来了阻碍。

3、“古籍电子定本工程”的启动和实施一方面需要有雄厚的资源积累和强大的技术支持,另一方面还需要有专业团队的紧密配合和权威专家的学术指导。而在这两方面,首都师范大学和国学网无疑拥有得天独厚的优势,其已建成的《国学宝典》收录先秦至清末4000余种传世原典,总字数逾10亿字,近10万卷,是目前国内最大的古籍全文检索数据库,这无论在资源、技术,还是人力、学术上,都已为“古籍电子定本工程”奠定了坚实的基础。

4、新中国成立以来,国家非常重视古籍整理与保护工作,产生了大量的古籍整理成果,使得我们具有了实施这项划时代意义文化工程的条件,它的推出无论在技术、功能和应用价值上都是继四库全书电子版之后的一项新突破。

5、计算机技术飞速发展,使海量的古籍书影存储变得更加容易,给项目的实施提供了便捷的保障。

6、超大字库的普及,可以完整准确地录入和显示中国历代古籍。

四、组织机构

 “古籍电子定本工程”下设顾问组、专家组和工作组,“古籍电子定本工程办公室”设在国学网(www.guoxue.com)。

负责版本审定、工作指导以及疑难

问题解答。

 




文本框:电子定本专家组
负责电子定本的工作监督、版本选


定、确定字形等。

 




文本框:电子定本工作组
负责电子定本的数据加工、整


理、发布等相关工作

 

1  组织机构

①顾问组:由全国著名专家学者领衔,对电子定本工程给予学术指导。拟邀:汤一介,冯其庸,傅熹年,傅璇琮,袁行霈,杨成凯,许逸民。

②专家组:由多位古籍整理专家组成,负责底本选择和电子定本的审定。拟邀:刘石,李根,韩格平,周延良,李浩,王子今,方铭,赵敏俐,刘晓明,谢思炜,胡晓明,张希清,廖名春,刘明华,汪少华,刘刚,左东岭,吴湘洲等。

③工作组:由特聘古籍专家和计算机专家组成,负责电子数加工、发布和相关工作。

五、工作流程(见图2

 




文本框:1、精选底本





文本框:2、扫描图像并编码





文本框:3、全文录入、标点





文本框:4、图文对照精校







文本框:5、专用软件排版
文本框:专用加工程序







文本框:6、竖排繁简体文本
文本框:网页





文本框:7、数据合成打包





文本框:8、浏览平台









文本框:网络版
文本框:手机版
文本框:单机版





文本框:9、、网上公示、反馈


 






文本框:10、纸本打印、专家签字、数据定型
文本框:11、数据修订


2  工作流程图

注:①每种电子定本数据必须有一个唯一的底本。同一种书有两个或更多底本时,每一底本对应一个电子定本。

②典籍以常用的国学经典为主,版本主优先使用学术界公认的权威版。

③每部书有一个唯一的点校者,点校者应为具有高级职称或同等资历的专家。

④指数据录入、校对,包括字形校对和少数非汉定符号。

⑤网上公示期一般为3个月,最短不少于1个月,最后应有1个月的悬赏纠错期。

⑥鉴定定型应打印成文图对应的纸本,由3位专家和点校者签名存档。“古籍电子定本鉴定专家组”半数以上的专家本人签名。

⑦正式发布时在网页上标示“古籍电子定本”商标。

⑧“电子定本工程”严格执行国家关于语言文字和信息发布的相关规定。

⑨使用方式:在网上提供底本图像、电子定本网页,供全球的网友使用。所有的电子定本产品都将形成光盘,用户可以在个人计算机上单机使用。

六、依据及标准

1、选书标准

典籍选择:以日常使用率较高、脍炙人口的经典著作和作品为主。

版本选择:以通行的学术界公认的权威版本为依据。

2、文字处理标准

严格遵循国家相关部门颁发的规范:

195512月发布的《第一批异体字整理表》

19651月文化部和中国文字改革委员联合发布的《印刷通用汉字字形表》

198610月发布的《简化字总表》

19883月国家语委发布的《现代汉语通用字表》

3、字库使用

电子定本工程使用“宋体-方正超大字符集”。

4、文字整理

电子定本工程在文字处理上,我们借用《周易》之“易”来概括其大旨:

①不易。即最大程度上保持定本繁体版的文字与底本一致,不作随意的修改处理。

②变易。即在特殊场合,作必要的改易,以满足在计算机平台上的使用。如《六朝文�》清刻本的“�”字,在普通字库中作“鼯”,本工程便不再保留原字形。

③简易。古籍用字千姿百态,体现了先民和历代书家、刻工的创造力,但一字多形,也给古籍的传播推广带来极大的困扰。为了减少不必要的“噪音”,对差异较小的异形字,本工程将按统一的体例,谨慎地做一些合并规范,采用一种。如“�、教”统一作“教”,“�、�”统一作“�”。

七、结语

作为承载华夏文明重要载体的古代传世典籍可谓浩如烟海、汗牛充栋,整理并传播古籍,事关文化传承。时代需要我们古为今用、推陈出新,既要继承传统又要超越传统。

在科学技术一日千里,迅猛发展的今天,亟需我们用现代理念对传统文化进行再认识,用现代手段对传统文化进行再表现,用现代研究成果对传统文化进行补充。随着社会的进步和科学技术的发展,突出的数字化已经显露了信息传播和利用上的极大优势。这一点就规模较大的古籍来说,优势更为明显。

电子版古籍的信息容量非常巨大,检索方便,易于保存,有传统的纸质出版物无法替代的优势,深受学界或读者的欢迎。现代信息技术对古籍出版整理工作提出了新的挑战,也为传统的古籍整理拓展了新的领域。

顺应时代发展的需求,对古籍数字化整理起到规范化、标准化作用的“电子定本工程”的全面启动与实施,无疑将会对我国古籍的保存、传播或使用发挥更大的作用,起到深远的影响。

附:古籍电子定本工程方案

    古籍电子定本工程采用五星级质量控制体系,按整理流程依次将电子定本划分为如下五个等级:

星级

星标

阶段

星级

文图对照

二星级

★★

初审

三星级

★★★

审校结束

四星级

★★★★

网上公示

五星级

★★★★★

定本发布

3  古籍电子定本整理体例

(一)古籍电子定本遵循“择优而定,从善为本”的原则,慎重选择学界公认的权威版本为底本进行整理。每种书由一套底本原图和三套电子文本组成。三套电子文本是:①原图版式简体,②原图版式繁体,③标点整理简体(网页格式)。

(二)古籍电子定本以Unicode编码,以便于直接引用为目的。其对于底本的还原,不求纤毫毕肖,但求面目可识,规范化的同时,又不乏灵活性。

(三)古籍电子定本统一采用GSBN编号。例:7-101-0001-01

(四)古籍电子定本校勘编号表达式为:卷数-页码-列数/字数。例:J2-P3-4/5即表示第二卷第三页右数第四列第五字。

(五)底本中的避讳字悉予保留,不作复原。如秦代以“端”代“正”避始皇,汉代以“国”代“邦”避高祖之讳,以“茂”代“秀”避光武之,唐代以“人”代“民”避太宗之,以“通”代“亨”避宗之讳,清代以“元”代“玄”避康熙之,等等,皆从其故。以缺末笔形式出现的避讳字,如“玄”、“胤”,“真”,“徵”等避讳字均缺末笔,仍以整字表示,另在原版式繁体中加框注明。

(六)底本中的异体字、俗体字及同音假借字,如:唯/惟、�/无、/于、�/�、睹/�、凋/、修/�,等等,一应保留原貌。

(七)由于抄刻习惯和时代、地域差异造成的异形字,如:�/教、�/�、�/�、�/兹、�/群,等等,一般予以规范,合并统一为正形字。

(八)凡因底本残损污没所致之缺字,如“主”缺头上点,“子”缺腰间横,“玉”字缺左半边,等等,悉据上下文及他本予以补全。

(九)凡属底本明显衍脱讹倒之处,均据他本予以订正,并出校勘说明。

(十)底本中若有特殊标注,如夹注、眉批、印章、画符等等,一般不予处理

(十一)简体版字形统一使用《简化字总表》中的字形;《简化字总表》以外的生僻字,按照1992年新闻出版署、国家语言文字工作委员会发布的《出版物汉字使用管理规定》,一般不作偏旁简化和类推简化。如:�、�、�、�、�、�、�等字,均不做简化处理。

(十二)古籍电子定本中所有标点皆由专家署名整理,属个人成果。

(十三)其他复杂情况由专家委员会审定,并出具书面意见。

(十四)古籍电子定本整理体例解释权归国学网所有。

 

尹小林  首都师范大学国学传播中心主任,国学网站总裁。