《中国历代石刻史料汇编》(网络版)检索功能评价 王丽华
发布时间:2018-09-25  浏览次数:36

《中国历代石刻史料汇编》(网络版)检索功能评价

王丽华

(吉林大学图书馆长春130012

    《中国历代石刻史料汇编》是由北京书同文数字化技术有限公司开发研制的一款有关历代石刻资料的全文检索软件。有单机版和网络版两种。它提供纲目浏览和全文检索,检索功能强大,数据质量较高,但亦存在一些不尽如人意的地方。

关键词  《中国历代石刻史料汇编》古籍数字化检索功能

 

随着计算机技术的飞速发展,数字图书馆(电子图书馆、虚拟图书馆)和大型电子文献资料库的开发和建设,近年来已成为学术界和相关技术部门的一个热门话题。其中,古籍的数字化也得到了高度重视。并且,伴随着《四库全书》、《二十五史》、《古今图书集成》、《四部丛刊》等大型电子版古籍的相继问世,为各界学者提供了方便快捷的获取资料的工具,数字化的古籍在学术研究中的利用率也在不断提高。《中国历代石刻史料汇编》(以下简称《石刻》)就是众多成功的数字化古籍之一。它的网络版的问世,使读者足不出户便可检索到所需金石资料。

《石刻》是由北京书同文数字化技术有限公司开发研制的一款有关历代石刻资料的全文检索软件。有单机版和网络版两种。下面仅就使用过程中的心得,略述其网络版检索功能的利弊。

1极具特色的全文检索软件

11强大的全文检索工具

古籍的全文检索是网络信息检索应用最为直接和最为有效的手段。《石刻》全文检索软件中的文献资料经过全文数字化,文献内容基本达到字字可查、句句可检。且系统提供中日、简繁、异体汉字关联查询,打破了时空、地域的汉字使用习惯,增强了知识检索的全面性。软件亦提供逻辑检索及字、词间距检索。同时读者也可以不输入任何检索文字依据左侧的书名浏览碑文。此外系统还提供联机字典、文字代码页与原书图像页关联、复制打印、添加注释、纪年换算、八卦查询以及手写输入等功能。这些都是学者在研究过程中需要经常使用的,有了这些检索功能,学者的研究便事半功倍。《石刻》全文检索软件已经成为学者进行学术研究不可或缺的现代化工具。

12高质量的数据保证

数据处理生产线使用书同文公司自主研发的工具产品 ――“数码翰林”,利用OCR自动识别技术,结合联机校对软件及专家级的疑难字甄别过程,实现高效率的全文数字化工作,确保文字的高质量输出。

13多语言平台支持

无论读者使用何种语言的Windows操作平台,均可无障碍地运行该软件,使《石刻》电子版成为传播中国传统文化的媒介。

14精致的用户界面

软件提供精致仿古的用户界面,使读者在检索浏览的同时获得精品般的视觉感受。

2所据底本内容丰富

石刻文献资料信息量大、研究成果分布零散,即使是专业研究人员,也很难在短时期内将大量文献资料收集齐备。与石刻文献的整理考释工作相比,数字化和索引数据库编制工作相对滞后,给研究者带来利用上的极大不便。《石刻》的问世可以说是学术界的一大喜事。其所据底本为国家图书馆善本金石组所编,是经过众多金石专家对现存千余种的金石志书(包括地方志中的金石志)中的金石文献,进行仔细甄选,认真对比去重,从中精心辑录出一万五千余篇石刻文献,并附有历代金石学家撰写的考释文字,总计1150万字。内容涵盖中国古代政治、经济、军事、民族、宗教、文学、科技、民俗、教育、地理等各个方面,堪称大型中国古代史料文献汇编。同时,石刻文献因制作的特殊性而极少脱、讹、衍、误等,故其史料性和真实性向为学界所重。因此也可以说,该书是研究中国古代社会文化各个方面十分难得的第一手资料。

3检索方式多样

《石刻》的检索方式有纲目浏览和全文检索两种。

“纲目浏览”:不用输入任何信息即可浏览到碑文。首先点击画面左边的纲目。这个纲目是按照“汇编书名”→“朝代”→“碑文”的顺序开展的。当点击“书名”时,左边栏目会将汇编中全部书名列出;当点击某部书名时,在该书下面就会列出该书所含的朝代等信息;再点击某朝代,即在右面窗口列出该朝代所收入的碑文名称;再点击右面碑文名后,即可看到该篇碑文全文。这种“纲目浏览”,适合事先有明确的书名等查找途径的读者使用。如果没有这种明确的查找目的,则可使用“全文检索”查询。

“全文检索”:顾名思义,就是当输入一个或两个检索字词时,系统将在全部碑文中搜索,然后把凡是含有检索字词的碑文列出(在右边画面),以供点击查看。凡命中者均标以深颜色。您可对其鉴别、拷贝下载。当同时提出两个检索字词时,还可以选择二者间的“与”(即要同时含两个字词的资料)、“或”(凡含有两个字词或其中之一字词都要)、“字间距”(控制二者之间相隔字数,间距愈小,愈是接近所要的专题资料)关系,可查询到更准确的资料。

古代碑文使用了大量的繁体、异体汉字,《石刻》为用户提供了简//异、中/日汉字关联检索功能,只要熟悉其中一种文字即可查全。

4方便的辅助输入

对于不熟悉电脑上固有的汉字输入方法的读者来说,可以选择书同文公司特意提供的“辅助输入”方法,仅用鼠标即可完成汉字输入,如知道拼音或笔画、部首即可输入检索文字。

5存在的问题

51打开客户端后为全屏显示,将任务栏掩盖,只有最小化或按windows”键方能看到任务栏,即只有最小化才可以切换到文本文档进行编辑。使用这个软件就是为了获取其中的资料,经常需要在客户端与文本文档之间切换,目前软件这种全屏方式给用户带来诸多不便。

52左侧书名排序杂乱,让人摸不着头脑,没有检索意义且给用户带来麻烦。《石刻》目前的排序让人找不到规律,相同书名的书被排到好几个地方,让用户无法看到全书的内容,有些零乱的感觉。如果是一种书分成数编,那么也应该放在一起,按编数排列在同一书名下,且书名的排列要有规律,如按笔画多少,或按拼音的首字母,或按其他方式排列,总之不要太杂乱无章,应便于读者检索。目前分类浏览根本不能满足用户的需求。原书“所有碑文按朝代排序,利于读者查阅”,《石刻》电子版为何不能如此呢?如果读者既能进行全文检索,又能按书名或时代浏览,其《石刻》的使用价值会更高。

53检索功能欠全面,检索结果不准,检索途径太过单一,词语关联性不好。目前《石刻》仅提供全文检索(因左侧书名排序零乱,故无法按书名检索或浏览),这样远远不能满足用户的需求,一般检索石刻资料均需从石刻的年代进行检索。目前《石刻》中,输入年代,检出的仅是出现在全文中的,一少部分是石刻的年代,相当多的并非某一石刻的年代,对志名或碑名后面括号内的年代似乎不能检索,所以目前《石刻》无此检索功能。其二,目前亦无法通过书名及著者进行检索,亦给用户的使用带来不便。其三,检索结果不能直接转换成简体字,如果加上两种字体的选择按钮会好一些。例如:如欲检“李谋墓志”,因其志题为“大魏故介休县令李明府墓志”,故输入检索词“李明府墓志”,其检索结果为零。而输入“李谋”能检到此志,且其志题中分明有“李明府墓志”五字,为何检不出来呢?还有,以“魏故南秦州刺史司马使君之墓志铭”检索,结果是未命中;再以“司马升”检索,命中。且在文本页面中前次未命中的检索词在文中是存在着的。这样的例子很多,似乎均是未做相应的关联所造成的。有时明明知道某一石刻收在某一书中,此书又收在《石刻》中,却在《石刻》中检索不到。检索结果如此欠准确大大降低了《石刻》的价值。

兹举一例:检“马寿”,输入简体“马寿”,命中结果为一条(见图1)。

全文�索�件:

�索字串:马()寿()

�索�果:一共1�匹配,�前�示第1至第1��果   

 

匹配��

匹配字符串

碑文名

 

1

�寿�

加�孔子��碑(泰定二年)

1

如果以繁体字检,则命中二条记录(见图2)。

全文�索�件:

�索字串:�()(,寿)

�索�果:一共2�匹配,�前�示第1至第2��果   

 

匹配��

匹配字符串

碑文名

 

1

��墓��大唐�䖏士

��墓��(��三年)

2

�寿�

加�孔子��碑(泰定二年)

2

54不够人性化,可供用户设置的东西太少,只有“配色方案”及“字体”可以设置,这两项对于使用者来说又是最不重要的。

55《石刻》中偶见错字,且由图像转换成文本时脱字太多。这可能跟其所使用软件的局限性有关,亦是其未做认真的人工校对所致。在原文图像中可以辨认而在文本页面变成“囗”或菱形的情况俯拾皆是,读者需反复切换界面进行填补,给读者的使用带来很大不便。现仅举错字一例如下:

1

2

善王墓志大唐孟墓志

孟普王墓志(咸亨三年)

应为孟善王

虽然《石刻》中存在一些不足之处,但瑕不掩瑜,它仍是一个相对方便实用的软件,于读者检索带来的便利远远大于它的不足。

参考文献

1北京书同文数字化技术有限公司,《中国历代石刻史料汇编》全文检索版用户手册

王丽华,吉林大学图书馆古籍部工作。