索引与数据库漫笔(连载) 张琪玉
发布时间:2018-09-25  浏览次数:8

索引与数据库漫笔(连载)

(南京政治学院上海分院信息管理系  200433)

 

19  自由标引中标引副标题概念词的问题

1 本文用词说明

本文所用“自由标引”一词是指不依据词表的人工标引,属于自然语言标引的范畴。期刊论文的在版标引一般都是自由标引。自由词补充标引是受控标引与自由标引的结合,不包括在本文讨论的范围内。

本文所用“副标题概念”一词是指在后组式标引的情况下,相当于一切非主标题的概念,也就是说,所标引用词不能独立进行检索者。“副标题概念词”包括细分主标题用的方面组配词和提高主标题专指度用的限定组配词。

2 自由标引中标引副标题概念词的副作用

一般来说,在自由标引中,标引副标题概念词利少弊多,因为:相当于副标题概念的词表达的内容很多,在标引中用词的自由度又很大(可以用这个自然语言词表达,也可以用那个自然语言词表达,可以标引副标题概念,也可以不标引副标题概念),故标引结果的分散性(或者说多样性)要比主题事物的同义词造成的分散性大得多,在检索时如果用这类词进行组配检索,以缩小检索范围,提高检索提问的专指度,似乎可以提高检准率,但因检索者难于全面列其同义概念词而造成极大漏检,有时甚至不知道怎样表达副标题概念而造成检索结果为“零”。在自由标引中使用副标题概念词所造成的漏检远比其所造成的误检,对检索效率的危害大,是很得不偿失的。

3 标引副标题概念词的条件

(1) 在不可能对副标题概念词进行标引控制的情况下,以一律不标引副标题概念词为好;

(2) 自由标引系统配置带大量入口词的副标题概念词表,标引时副标题概念一律依据该词表标引,检索时用该词表将表达副标题概念的词自动规范;

(3) 在自由标引中,方面词与主题词联结在一起成为先组散组式标识(如“图书馆――发展趋势”),不用限定组配标识而用直接专指词(如不用“网络――信息资源”而直接用“网络信息资源”或“信息资源,网络”。

4 对期刊论文在版标引的建议

从期刊论文在版标引缺乏象图书在版标引那样的有效控制(不仅依据词表而且经过版本图书馆对CIP数据进行核查)看,建议取消对副标题概念进行标引,或采取3(3)节的方法进行标引。

20  虚拟文集与虚拟文集内容索引

1 虚拟文集与虚拟文集内容索引可能成为为研究项目服务的一种形式

为研究项目进行个性化服务,是参考咨询服务的高级形式。

每个研究项目在正式进行之前,为了了解前人是否进行过相关研究,都要进行文献普查和收集有参考价值的资料,以避免重复研究和继承前人的研究成果。这是研究项目的前期劳动。这种前期劳动既可由研究人员本人去做,也可委托图书情报资料人员去做,这就是图书情报资料机构的定题服务。图书情报资料人员不但在课题进行之前可以代为进行文献普查和收集参考资料,而且在课题进行过程中还可进行“跟踪服务”。

图书情报资料人员的这种个性化服务,一般是以提供作为普查结果的文献索引和参考资料复印件作为服务形式的。在当前计算机检索和网络检索已经比较普及的情况下,可以向课题组提供带有内容索引的“虚拟文集”来实现。

2 虚拟文集的编制

所谓“虚拟文集”,是指在正式出版物和内部出版物中并不存在的,只是类似于文集的参考文献的专题汇编。

虚拟文集可以有三种形式:(1)纯数字型虚拟文集;(2)纯复印型虚拟文集;(3)部分数字型、部分复印型虚拟文集。

虚拟文集的编制过程:(1)分析研究课题涉及的文献范围;(2)文献普查(检索、查寻)(3)查获文献的甄别、复制;(4)编辑整理;(5)编制文献目录(如果文献较多,可粗分类,并可附加一著者目录)

3 虚拟文集内容索引的编制

为虚拟文集编制内容索引,是为了方便、快速、全面查找文集中的特定内容(所谓“知识单元”)

虚拟文集内容索引的索引深度,以介于全文关键词遍历索引和论文主题索引之间为宜,大致与图书索引(书后索引)相当,并可采用书后索引的方法与规则。

虚拟文集内容索引出处项的表示法:(1)对于数字型文献:以篇为单位编顺序号;同一篇内,以文段为单位编顺序号;(2)对于复印型文献,以篇为单位编顺序号;同一篇内,以页为单位编顺序号。或者,整个复印文献统一的顺序号。


张琪玉  南京政治学院上海分院信息管理系教授,中国索引学会副理事长。