“中华字库”工程 ——中华民族有史以来规模最大的汉字及少数民族文字整理工作 孟 忻
发布时间:2018-09-27  浏览次数:195

“中华字库”工程

——中华民族有史以来规模最大的汉字及少数民族文字整理工作

 

  

(吉林大学古籍研究所  长春   130012

 

    “中华字库”工程,是引领中华文化步入信息化、数字化时代,提高中国文化“软实力”的一项重要举措,有着重大的战略意义。是中华民族有史以来规模最大的汉字及少数民族文字整理工作。

关键词  中华字库  中文数据库  文化建设

 

2011726-28日在北京友谊宾馆召开了“中华字库”研发工作启动大会。这项工程是由中国出版集团公司牵头负责的,是列入《国家“十一五”时期文化发展规划纲要》的重大建设项目,也是国家《文化产业振兴规划》中特别指出的具有带动作用的重大文化建设项目。

组织实施“中华字库”工程,是引领中华文化步入信息化、数字化时代,提高中国文化“软实力”的一项重要举措,有着重大的战略意义:

“中华字库”工程是实现新闻出版业跨越式发展战略的迫切需要

从世界范围看,数字技术的迅猛发展对出版产业的产品生产、加工与传播方式都产生了深远的影响,出版产业格局正在发生变革;从国内情况看,出版体制改革正在逐步推进,我国出版产业正处在转型升级、实现跨越式发展的历史阶段。我们必须自主创新,抓住科技进步带来的机遇,通过具有战略性、引导性和带动性的重大新闻出版科技工程的实施,推进产业升级,提高企业和产品的市场竞争力。

“中华字库”工程正是顺应时代发展的要求,推动我国出版产业。字库工程将利用现代技术,在统一的平台上,按照统一的标准的规范,对古今汉字、少数民族文字、计算机编码字符进行系统的整理并在此基础上全面解决古今汉字、少数民族文字、计算机编码字符集的编码问题,同时还要重点研发汉字及少数民族文字的主要字体字符库,同时还要重点研发汉字的编码体系,输入输出,存储传输以及兼容等关键技术。这一重大工程是中华民族有史以来规模最大的汉字及少数民族文字整理工作。完成后的“中华字库”预计可编码字符数达到50万左右,包括汉字古文字约10万、楷书汉字约30万、各少数民族文字约10万,并将形成我国多语种文字的数字化处理技术体系。

“中华字库”工程是加快国家信息化建设战略的重要基础

“中华字库”工程不仅是行业的需要,而且对国家的信息化建设具有重大意义。我国的字库建设工作开始得很早,电子标准化所很早就开始编码工作,像我们现在用的GB2312,(6763个汉字)。汉字编码经过很多年,曾经提出过好几个辅助集。从1984年开始,国际标准化组织统一建立起国际编码标准,将全球的各种符号纳入一个编码体系,其中汉字是由中国的大陆和台湾、日本、韩国四方对已有的编码文字进行筛选甄别整理后,形成所谓的CJK大字符集。现在这个大字符集已经有扩展A集,扩展B集,共7万个字。信息化是当今世界发展的大趋势,是经济社会发展和变革的重要推动力。我们正在建设的经济信息平台、人口基础信息库、自然资源和地理空间基础信息库等国家信息化的基础性项目,由于编码字符的不足,在推进过程中遇到了不同程度的困难;在公安、民政等政府管理领域,通信、邮政、金融、保险、海关、民航等行业领域,由于现有字库的缺字,也引发了一系列问题,制约着我国信息服务水平和监管能力。“中华字库”工程建成后,将能够满足国家信息化建设和发展的需要,解决各部门、各行业的用字问题,还可以适应两岸四地间信息互联互通的需求。

“中华字库”工程是实施国家文化发展战略和必然要求

在全球信息化的今天,传承和发扬传统优秀文化是中华文化全面走向世界的基础。我们亟需对全国各民族的古今文字进行广泛全面的搜集整理,将它们构建成符合信息化传播要求的字库,从而使几十万种传世文献能够在无限的网络空间广泛传播。我们现有的字库只收入了7万多字,古汉字及许多少数民族文字都没有纳入,远远满足不了总结和传承文献、传播中华文化的需要。用“中华字库”建立和各类文档或数据库,能方便地检索、排序,而且能在国际间无障碍地传输,将会实现历代中华文献的电子典藏和网络传播,在继承和发扬中华优秀传统文化的基础上实现中华文化的创新,带动我国文化产业的发展,为国家文化发展战略奠定稳固的基础。

目前,互联网上的中文数据库太少,是一个亟待解决的问题,对于数据库工作者来说,这是一项历史任务,也是一个严峻的挑战。中文数据库研究与编制软件已经出现并取得了初步成效,如上海图书馆研制的《全国报刊索引数据库》、广西大学研制的《古今图书集成索引》(网络版)以及北京印刷学院研发的中文索引编制软件——“索引之星”等。在当今信息社会,数据库是一种最基本的管理和传播信息的工具,是互联网发展的重要支柱之一,是整个社会信息化的一个重要因素。数据库这种现代化的索引形式,其编制和使用技术的广泛应用,推动了索引工作的现代化。

 

参考文献

1  尚烨.“中华字库”工程研发工作正式启动[EB/OL.2012-12-25. http://cips.chinapublish.com.cn/chinapublish/tpxw/201107/t20110726_91378.html

2  吴娜.“中华字库”这里没有你找不到的字[N.光明日报,2011-8-24(9)

3  吴娜.“中华字库”工程启动——含全部汉字和少数民族文字[N.光明日报,2011-7-27(3)

4  黄小希,吕虹.“中华字库”工程关注数字化需求[N.中国文化报,2011-7-29(5)

5  桂永抓住建会二十周年发展契机 进一步繁荣我国索引事业——在2011年中国索引学会年会暨成立二十周年庆典大会上的工作报告.中国索引,20114

 

    女,1962年生,吉林大学古籍研究所副研究馆员。发表图书馆学方面论文十余篇。