张琪玉情报语言学语录 周延疆 周香平
发布时间:2018-09-25  浏览次数:20

张琪玉情报语言学语录

周延疆编  香平审

(新疆自治区图书馆  乌鲁木齐  830011

笔者按  张琪玉教授,193067生。19547月毕业于北京大学图书馆学系。曾任新疆维吾尔自治区图书馆副馆长、武汉大学图书馆情报学院教授暨图书馆学情报学研究所所长、空军政治学院图书档案系(现为南京政治学院军事信息管理系)主任、中国图书馆学会理事、中国索引学会副理事长暨学术研究委员会主任、上海市图书馆学会副理长暨学术研究委员会主任、世界知识组织学会会员等。主要研究领域为情报语言学,是该学科领域的开拓者。1985年获国家科学技术进步奖一等奖,1996年获国家优秀科技信息成果奖二等奖,19917月获国务院颁发的政府特殊津贴。简历载入《中国大百科全书》图书馆学情报学档案学卷、《世界名人录》中国卷等。

《张琪玉情报语言学文集》(北京图书馆出版社,19995月第1版)概括了张琪玉学术轨迹、理论成果和学术观点,内容丰富,哲理深刻,对情报检索语言学术研究和实践有重大价值。现将文集中若干学术观点以语录形式摘编如下,以飨读者。

关键词  张琪玉   情报语言学   学术观点

 

1  情报检索语言〔分类法,主题法,其他文献内容检索方法〕是表达一系列概括文献情报内容的概念及其相互关系的概念标识系统,其职能是作为情报检索系统的语言保证,其核心问题是检索效率。(《张琪玉与情报语言学学科建设》〔代自序〕3页,总3页)

2  在计算机检索日益发展的条件下,自然语言具有不可阻挡的发展前途。(〔代自序〕5页,总5页)

3  对于高要求的情报检索来说,控制是绝对必要的。而对检索过程进行控制,正是情报语言学的精髓。(〔代自序〕5页,总5页)

4  主要研究方法是结构功能分析法。(〔代自序〕5页,总5页)

5  理想的情报检索语言应是:学科聚类系统与事物聚类系统的结合(事物聚类也应当有系统性,字顺序列可作为进入事物聚类系统的手段),先组式语言与后组式语言的结合,体系分类法与组配分类法的结合,人工语言与自然语言的结合,号码标识与语词标识的结合,系统序列与字顺序列的结合,不变概念代码与可变概念体系的结合。上述结合方案的主要实现方法是:分面分析+概念代码+概念对应转换+数据库技术。(〔代自序〕6页,总6页)

6  理想的情报检索语言应是:①既可以从学科、专业角度检索,又可从事物角度检索;②既可按系统入手检索,又可按字顺入手检索;③既可先组式使用,又可后组式使用;④既可进行专指性检索,又可进行泛指性检索;⑤既可用词进行标引和检索,又可用号码进行标引和检索;⑥既可用人工语言进行标引和检索,又可用自然语言进行标引和检索。理想的情报检索语言应是“学科-事物概念组配型检索语言”。它由学科分类系统面和事物分类系统面构成,两个面可互相组配。当按学科聚类时,借助于事物及其部分面进行复分;当按事物聚类时,借助于学科及其问题面进行复分。(《情报检索语言的发展趋势――与吴建中的对话》3页,总121页)

7  创造情境检索语言的新类型。(《论情报检索语言的研究、创制与普及》5页,总14页)

8  要特别重视研究情报检索语言中的组配原理,研究组配型的分类法和主题法。(同上,6页,总15页)

9  人工语言和自然语言相结合,既是严密的人工语言,又尽量利用自然语言作为辅助,无疑有助于检索效率的提高,因而是情报检索语言发展的正确方向。(同上,6页,总15页)

10  对情报检索语言,从宏观和微观两个层次分析解剖其结构与功能的关系,是极重要的一种研究方法。(同上,6页,总15页)

11  解决情报检索语言问题必须采取两种措施:一种措施是搞标准化,另一种措施是开展新语种的创制工作。(同上,8页,总17页)

12  情报检索语言特点之一是能简单明白又比较专指地表达文献及检索课题的主题概念。(《情报检索语言》,3页,总23页)

13  情报检索语言的性能要求:

①既能从学科、专业出发进行检索,又能从事物出发进行检索;②既能较好地进行族性检索,又能较好地进行特性检索;③能视检索过程中出现的具体情况而自由地扩大、缩小或改变检索范围;④能进行多途径检索;⑤能进行多因素检索,即按任何特征组配检索,或者用布尔代数表达检索课题和进行逻辑运算,实现精确检索。(同上,7页,总27页)

14  一般认为,从学科、专业出发的检索要求是族性检索要求,从事物出发的检索要求是特性检索要求;认为分类法系统各种语言的职能主要是满足族性检索的要求,主题法系统各种语言的职能主要是满足特性检索的要求。其实,无论是从学科、专业出发的检索(可以称学科检索或分类检索),还是从事物出发的检索(可以称事物检索或主题检索),都有族性检索,即范围较广泛的检索,和特性检索,即范围较狭窄的检索。任何情报检索语言,都应采取一定的方法和手段,力求既适合于族性检索的要求,也适合于特性检索的要求。(同上,7页,总27页)

15  概念逻辑是一种科学思维方法。(同上,11页,总31页)

16  客观世界事物既是多样性、千差万别的,又是统一的、有层次的。将事物概念纳入知识分类体系(事物和学科的分类体系),是对千差万别的事作物作系统研究的重要方法,是对各种事物之间的区别和联系从本质上、原理上进行揭示的重要手段,对情报的系统化具有重大价值。(同上,17页,总37页)

17  文献分析质量标准:①既不遗漏有参考价值的内容,又不将无参考价值的内容或文献中根本不存在的东西作为分析的结果;②正确表达文献的内容,即形成正确的概念;③正确判断语言献中论述的重点;④抓住文献中提出的新东西。(同上,20页,总40页)

18  文献标引质量标准:①正确运用情报检索语言,选用确切的标识表达文献分析结果所形成的概念;②对文献分析结果的标引既要有所选择取舍,又不要遗漏有价值的情报;③对同一概念的标引要前后一致。(同上,20-21页,总40-41页)

19  文献的标引深度取决于主题分析水平。

20  文献内容分析的目的:①要全面查明每篇文献潜在的多种用途;②要用全力找出文献中对本单位服务对象有用的情报。(1920条出处同上,22页,总42页)

21  放宽标引的网罗范围可提高检全率,但会降低检准率,收缩标引的网罗范围可提高检准率,但又会降低检全率,因此,就有必要探讨如何对标引的网罗范围作适中控制,即适度标引问题。(同上,26页,总46页)

22  适度标引的内容必须同时符合下面三个条件:①文献中比较具体地论述了的;②有一定参考价值的;③可以成为检索对象的。(同上,27页,总47页)

23  最适合于计算机检索系统的情报检索语言应是组配式的,而且应当作后组式使用。(《情报语言学基础》,第8页,总57页)

24  标识的唯一性要求是指排除“多词一义”、“一词多义”和“词义含糊”现象,使标识与概念尽可能一一对应。(《情报检索语言方法综述》,5页,总135页)

25  情报检索语言不管是用语词的,还是用号码或代码的,都是一套表达概念及概念关系的标识。

26  情报检索语言的表达对象是有范围的,即都是文献主题。

27  情报检索语言从其作用原理来看,都可以概括为四项基本功能,即:①对文献的情报内容(及某些外表特征)加以标引;②对内容相同及相关的情报加以集中或揭示其相关性;③对大量情报加以系统化或组织化;④便于将标引用语和检索用语进行相符性比较。

28  情报检索语言的最基本的原理就是控制。

29  情报检索语言结构的移植或“仿制”,即不同情报检索语言结构的组合,能够增强、完善某种情报检索语言的功能,乃至设计出新颖的情报检索语言。

30  采用比较研究的方法研究各种情报检索语言在方法上的差异性,是对情报检索语言结构与功能关系的更深入的认识,是情报检索语言结构的改进、完善和创新的重要依据。(以上25-30条出处《情报检索语言原理的一致和方法的差异》第247页,总146148151页)

31  情报检索语言由词汇和语法组成。词汇是指登录在类表、词表中的全部标识,一个标识(分类号、检索词、代码)就是它的一个语词,而分类表、词表则是它的词典;语法是指如何创造和运用那些标识(单个标识或几个标识的组合)来正确表达文献内容和情报需要,以有效地实现情报检索的一整套规则。

32  情报检索语言的词法绝大部分是类表、词表编制过程中所用的方法和规则;句法绝大部分是文献标引过程和情报检索过程中所用的方法和规则。

33  检索词的造词方法,是指对自然语言中的词和词组(即造词材料)加以规范化处理,使之成为(改造成)合格的标引-检索用词。

34  合格的标引-检索用词,是指那些词符合唯一性、规律性、定型性、通用性、准确性以及政治思想上的正确性等质量要求,以保证在检索中有较高的效率。

35  词类规范是指规定哪些词类可作为标引-检索用词。词形规范主要是为了排除自然语言中的“多词一义”现象,从而使表达某一概念的标引-检索用词只有一种词形,可避免标引分散而漏检,同时也可达到使之符合通用性等要求。词义规范是指对自然语言中的多义词、同形异义词和词义含糊的词通过加限定词或注释,以排除“一词多义”现象,从而使一个标引-检索用词只表达一个概念,可避免误检。

36  在情报检索语言中,句子成分可分为表达事物的语词(主语)和陈述事物某一方面问题的语词(谓语,包括补语、状语)两部分,句子则可分为仅有主语的句子和有主语与谓语的句子两种基本类型。

37  通过组配,把两个或更多语词(表达简单概念的非专指标识)组合成句子(表达复杂概念的专指标识)。(以上31-27条出处:《情报检索语言语法体系初探》第2-6页,总153-157页)

38  聚类就是显示概念之间的关系,聚类的结构是构成文献主题概念的链、体系和网络。

39  概念逻辑和知识分类共同成为情报检索语言中聚类的基础。(以上38-39条出处:《情报检索语言中聚类的原理和方法》第8页,总167页)

40  配仅仅是指在标引和检索中的一种操作过程,即组配标引和组配检索。

41  组配法基于概念的可分析性和综合性,即概念的分析与综合。这种方法利用两个概念逻辑原理。

第一个逻辑原理,是在概念的交叉关系中,两个概念外延的重合部分(相同部分)可以形成一个新概念,这个新概念的内涵等于原来两个概念的内涵之和,并且它与原来的两个概念具有隶属关系。

第二个逻辑原理,是一个内涵较深的概念,也就是概念因素较多的复杂概念,可以分析(或者说分解)为两个或两个以上内涵较浅的概念,也就是概念因素较少的简单概念;或者相反,两个或两个以上内涵较浅,也就是概念因素较少的简单概念,可以综合(或者说合成)为一个内涵较深,也就是概念因素较多的复杂概念。

42  轮排是句式转换的主要方式。轮排,就是把组配标引句中所包含的各个有检索意义的分类号或检索词轮流排到检索入口位置。

43  句式转换,就是改变词序,产生更多的句子,达到从不同角度表达同一文献内容,以增加检索途径,使一个多因素主题能多向聚焦和响应多个检索课题。句式转换有多种方式:①轮排;②改写;③分拆。

44  关联符号的实质是将检索词分组,组配标引同一主题的几个主题词作为一组,给予同一组号。

职能符号的实质是对检索词的职能起限定作用,职能符号加在检索词后,如“泵a”“润滑系统b”表示泵的润滑系统,“泵b”“润滑系统a”表示润滑系统的泵。(以上40-44条出处:《组配及其演变》第126-8页,总174175179-181页)

45  概念逻辑和知识分类是一切情报检索语言的基础。

46  如果说概念逻辑是情报检索语言(包括分类法)的基础,则知识分类便是概念逻辑的基础。

47  分类法在建立自己的结构体系时,普遍地应用了概念逻辑的原理,特别是有效地利用了概念的划分与概括和概念的分析与综合两种逻辑方法。

48  知识分类包括事物分类和学科分类。

49  类目是一个表达文献情报内容或文献主题范围的概念,是构成分类法这类检索语言的细胞。(以上45-49条出处:《分类法与分类表》1-3页,总220-222页)

50  客观世界中具有某一共同属性的各种事物都可构成一类,而每一事物都具有许多属性,因此事物可以加入许多类。这就是事物的“多向成类”(或“多向成簇”)性质。(《体系分类法中集中与分散的矛盾》第4页,总258页)

51  多重列类法与最新标号法结合,既可提高检准率,也可提高检全率。例如:“公路石拱桥”这个文献主题可同时分入U44814公路桥、U44822拱式桥、U44832石桥三类,则它的最前标号法的分类号是U448142232,最后标号法的分类号是U448322214。(《关于“中图法”增加组配成分的可能性和方法的检索》第4页,总266页)

52  入口词是词表收录,但只能作为查词入口以引向正式词,而不能直接用于标引和检索的词。所以,入口词称为非标引-检索用词。入口词的范围很广,大致可分为两个来源:①编表过程中落选的词(指未被选为标引-检索用词即正式词的词),包括同义词、准同义词(含某些反义词和否定词)、太专指的词、被组代的词、某些相关词以及不同书面形式的词(不同写法、不同标题形式)等;②标引过程中记录下来的词,除增补上述各种情况的词以外,还有一些新事物、新学科和新概念的词。(《充分利用入口词原理》第1页,总325页)

 

说明

1�全部语录52条摘自《张琪玉情报语言学文集》一书,各条总××页指本书页数,并注明所引论文的名称页数。

2�本稿经张琪玉阅过,并同意发表。

3�本文转自:《西域图书馆论坛》20012期。