・索引与数据库术语・
索引名词简释:
(3)索引结构、索引语言和索引编制过程
【注】 本名词简释兼收录文献目录使用的部分名词术语,不收录文献数据库单独使用的名词术语。关于索引语言(情报检索言),仅收录较常用的名词术语。
A
按地区排序 目录或索引款目按地区特征排列次序。包括按地区名称字顺排列和按地区分类系统排列两种排列法。
B
半控标引 见 混合标引
半自动抽词 在文献题名或正文中用人工加插抽词符号(分词符号),然后通过程序按抽词符号自动将词抽出(切分出)并进行整理。这是不用抽词词典的一种抽词方法,比较简单,但速度较慢。这种方法也可用于为自动抽词词典积累素材。
报道性检索工具 一般指文摘刊物,具有报道文献的功能。报道性工具也具有检索功能。
报道量 检索工具一期或一年报道文献的数量,以文献款目的条数为计算单位。此概念也适用于文献数据库。
报道时差 又称报道时滞,简称时差。指从文献发表到被检索工具或文献数据库报道出来的时间间隔。时差越短,检索工具或数据库提供文献信息的新颖性越强。
笔画笔形排检法 又称笔画笔顺排检法。笔画排检法的一种。其具体方法是:先按笔画数多少排序,同笔画数的汉字再按笔形(笔顺)区分并排序,笔画数和笔形若均相同,则将相同汉字归并;当第一个汉字相同时,再按以上规则比第二个汉字,依此类推。采用此法的排序规则不尽一致,无统一标准,但大同小异。笔形有四笔(点、横、直、撇)、五笔(点、横、直、撇、折)等的区别。
笔画排检法 简称笔画法,又称笔数法。按汉字的笔画数进行字顺排列的方法和规则。具体排列规则是:笔画少的在前,笔画多的在后。若同笔画数,则再按其他方法(如部首、笔形)排列。此法一般与其他排检法结合使用,很少单独使用。
笔形排检法 简称笔形法,又称笔顺法。按汉字的单笔笔形进行字顺排列的方法和规则。汉字笔形数无统一规定,有四笔、五笔、七笔之分,笔形先后也无统一规定。此法一般与其他排检法结合使用,很少单独使用。标引选词 选词是选取语词的意思。标引选词是指从词表范围内选取某些合适的语词来标引文献。
编年排检法 见时序排检法
标目 (1)在文献目录款目中,决定款目性质和款目排列位置,提供检索途径的一项文献特征。标目一般分为四种:题名标目、责任者标目、主题标目和分类标目;(2)在索引中,用来表达所指示的主题或事物,并控制款目的排列位置的词、词组或短语,提供检索途径。凡是具有检索意义的词、短语、符号、数字等均可作为标目。标目的类型决定索引的类型,例如以化学分子式为标目的索引便是分子式索引,其作用是为读者提供从分子式角度查找文献的检索途径。
标目注释 说明、限定、补充文献款目或索引款目标目涵义的文字。
标识,文献标识 标识是指登录在分类表、词表、代码表中的分类号、检索词、代码。一个标识,也就是情报检索语言的一个语词。文献标识是指通过文献标引工序实际给予一个文献主题的分类号、检索词、代码。文献标识是文献主题的书面表达形式。
标识串 又称标引句。组配分类法、叙词法等作先组散组式使用时的文献标识是由几段连成一串的,故称标识串。
标识定型性 指语词标识要求选用自然语言中比较定型的词语形式,这样可以提高排检效果,方便检索。使语词标识达到定型性要求的方法还有:用倒置法(逆写法)使词组中的定型单词移至前端;对不定型和半定型词组形式进行修改或改变标题形式,等等。
标识规范化处理 在情报检索语言创制过程中,为了使标识符合唯一性、规律性、定型性、通用性、准确性以及政治思想上的正确性等要求而进行的规范化工作,这是提高标识质量的重要措施。
标识含义明确性 标识具有外延清晰,不模棱两可,不需使用者去推敲思考“它到底包括什么、不包括什么”这种明确性。
标识通用性 指用作语词标识(检索词)的自然语言词是否具有通用性。例如,方言的通用性就差,不宜用作语词标识。对用作类名的词语也有通用性要求。
标识唯一性 指排除“多词一义”、“一词多义”和“词义含糊”现象,使标识与概念尽可能一一对应。排除“多词一义”现象可提高检全率,排除“一词多义”现象可提高检准率,排除“词义含糊”现象既可提高检全率,也可提高检准率。
标识政治思想上的正确性 即用作语词标识(检索词)的自然语言词是否符合政治思想上的正确性要求。例如,贬称不宜用作语词标识。对用作类名的词语也有政治思想上的正确性要求。
标识直观性 指具有一看标识即可知道它所表达的是什么概念或哪些概念因素这种直观性。例如,语词标识(检索词)就比号码标识(分类号)直观,分段的号码标识就比不分段的号码标识直观,层累制的号码标识就比顺序制的号码标识直观。
标题 (1)指标题词;(2)指文章的题名。
标题标引 见 标题词标引
标题参照 见 标题词参照
标题词 标题词检索语言的语词,又称标题。
标题词标引 又称标题标引。使用标题词的文献标引。
标题词参照 简称标题参照。标题法中显示标题词之间语义关系的主要方法,它有助于标引选词和检索选词。包括单纯参照(显示等同关系词)、相关参照(显示等级关系词和相关关系词)和一般参照(概括性、举例性的参照)三种类型。
标题词复分 用附加副标题词或说明语的方法使标题词的含义细化(专指化)。标题词复分大致可归纳为论旨复分、形式复分、时间复分和地区复分等几种。
标题词直接复分,标题词间接复分 (1)在进行标题词复分时,不使用过渡词的称为直接复分,使用过渡词的称为间接复分;(2)对标题词进行地区复分时,在具体地区前不冠国名、省名等最高一级或上级行政单位名称的,称为直接复分,否则称为间接复分。
标题款目 主题款目的一种,以标题词作为标目。标目所用标题词一般取自标题表,但也可以用自由标引法依据标题规则由标引人员自拟。
标引 查明文献的整体或局部内容对哪些学科专业、哪些专门问题的研究、哪些读者(用户)的工作、学习有参考价值,并用检索标识(分类号、检索词、代码、索引标目)表达出来,提供准确、有效的检索途径的处理过程。
标引-检索用词,非标引-检索用词 标引-检索用词是情报检索语言语词中的正式语词,包括标题词、单元词、叙词、正式分类号、代码以及自由词等,这些词可实际用以标引和检索文献。非标引-检索用词是情报检索语言语词中的非正式语词,包括非标题词、非单元词、非叙词、交替类号等,这些词都是标引-检索用词的等同关系词(或可视为等同关系词),不能实际用以标引和检索文献,只能起“检索入口”的作用。
标引不足,标引过度 适度标引必须同时符合下面三个条件:(1)文献中比较具体地论述了的;(2)有一定参考价值的;(3)可以成为检索对象的。如果同时具备了上述三个条件而不给予标引,可以认为是标引不足;而如果未同时具备上述三个条件而给予标引,则可以认为是标引过度。
标引策略 指在标引过程中对文献主题分析结果的取舍选择,准备提供哪些检索途径的决策。
标引成果共享 指集中编目、协作编目以及在版编目等措施,其标引成果可供共享。
标引词 见 检索词
标引错误 又称错标。标引误差之一。如选择标识错误、组配错误等,造成文献标引与文献主题不符。
标引对象 (1)被标引的文献;(2)文献所含的有检索意义的一切内容特征及某些外表特征。
标引方法 标引方法泛指分析水平、标引深度、分析角度、分析方法、标引方式和标引基本方法以及分析标引质量的评价标准等。
标引方式 在标引过程中对文献主题的取舍选择方式,决定提供哪些检索途径。主要有:(1)整体标引,是指对一部书或一篇文章的整体主题用一个标识来进行概括性标引;(2)全面标引,是指对一篇文献的各个局部主题或构成完整主题的各个主题因素分别标引。如有必要,同时对整体主题作概括性标引;如无必要,也可不再对整体主题作标引;(3)补充标引,是指除了对一篇文献的整体主题作概括性标引外,又对个别重要的局部主题或主题因素作单独标引;(4)重点标引(又称部分标引、局部标引、对口标引),是指仅仅选择一篇文献中对本单位服务对象有情报价值的个别局部主题作标引。
标引分散 指同一主题的文献被标引在不同的文献标识下,不能集中一处,会造成漏检。其原因:一是标识缺乏唯一性;二是标引不一致(如有的入上位类,有的入下位类);三是标引中的其他失误。
标引工具 指分类表、词表、代码表等标引工具书。标引工具的功用是:对某种情报检索语言所用标识起登记和释义作用,对周密选用标识以便准确、全面地标引和检索文献起保证作用,对文献标引人员和情报检索人员查找所需标识起方便作用。
标引工作 对文献进行主题分析和将分析出的文献主题概念转换成情报检索语言标识(分类号、检索词、代码)的操作过程。
标引工作效益 指标引工作的成本效益观点。一般是考虑:在编表和标引阶段多投资以提高检索性能(实际是在检索阶段少付出代价)比较合算,还是降低检索性能要求以减少投资(实际是在检索阶段多付出代价)比较合算。
标引规范化 指为保证标引工作质量而采取的各种规范措施。包括选择标引工具(分类表、词表)并规定其使用本、制订文献标引规则、规定标引工作制度等。
标引规则 为保证文献标引的准确性和一致性而制订的各种规则。包括主题分析规则、选词或归类规则、标引各种主题文献、各种类型文献、各种学科文献的细则。不同类型情报检索语言有不同的标引规则,不同单位使用同一类型的情报检索语言其标引规则也不尽相同。标引规则有国家标准、分类法或词表编制者制定的规则和使用单位自己制定的规则,可分为分类标引规则和主题标引规则。
标引过度 见 标引不足,标引过度
标引技巧 指针对不同的主题特征,在多种多样的标引方法中选择合适的标引方法。
标引句 见 标识串
标引模糊性 其实质是在标引中对网罗范围作适中控制的复杂性和困难性。原因在于:(1)一篇文献的内容,往往既可以综合为一个主题概念,也可以分析为许多主题概念,因此,到底该用多少标识进行标引才算合适,是无法作出硬性规定的;(2)评价一篇文献是否“有参考价值”,也往往因标引者的认识不同和检索者的要求不同而异,很难得出一个明确的标准。
标引能力 泛指情报检索语言的包罗概念能力,及时反映新概念能力,标引专指度。
标引频率 见 使用频率
标引人员 又称标引员。从事文献标引工作的图书情报工作人员。
标引深度,深度标引 标引深度又称引得深度、索引深度,是指对文献情报内容进行周详标引的程度,简单地说,是指标引一篇文献所用的标识数量。深度标引是指标引深度大,也叫深标引、详尽标引。这两个概念相似并且有关联,但不能混同。
标引适度控制 又称适度标引,即对标引的网罗范围作适中控制。对文献内容的标引既要充分,又不要过分,以便达到既有较高的检全率,又有较高的检准率。标引适度随文献内容对情报检索系统服务对象的情报价值不同和所用情报检索语言的类型不同而异。
标引手册 情报检索语言某语种的使用说明,是指导标引人员正确使用该种情报检索语言的指南。标引手册对检索人员也有帮助。
标引网罗范围 又称标引网罗度、网罗度。文献内容被标引的范围。一篇文献包含的主题一般不止一个,标引网罗范围具体表现为被标引主题的数量,即对文献情报内容表达的充分程度。
标引误差 见 文献分析标引错误
标引选词 见 编表选词,标引选词
标引一致性 不同标引人员标引相同文献,或同一标引人员在不同时间标引相同文献所用标识的一致程度。其计算方法是不同标引人员标引同一文献(或同一标引人员在不同时间标引同一文献)所用标识总数(不计重复)除以所用标识中相同标识的数量(不计重复)。标引一致性是衡量标引质量的重要指标之一。
标引用语,检索用语 标引人员在表达文献情报内容时所用的语词(或标识),叫标引用语,检索人员在表达情报需要时所用的语词(或标识),叫检索用语。标引用语和检索用语可以是情报检索语言,也可以是自然语言,或者是两种语言(例如,标引用语是情报检索语言,检索用语是自然语言,通过自然语言接口进行对应转换)。
标引语句 在情报检索语言中,赋予一个文献主题的标识,称为一个标引语句。标引语句可以只含一个语词(分类号或检索词等),也可以由多个语词组配而成。
标引质量 见 文献分析标引质量标准
标引著录 将标引结果进行记录的过程。即将选定的分类号或检索词按规则填入目录卡片的相应位置或数据库的相应字段的操作过程。
标引专指度 标引结果对文献内容揭示所达到的精确程度。但标引专指度因受所采用情报检索语言以及标引规则等的限制,而往往不能达到绝对专指。
标引专指性规则 指必须选用分类表或词表范围内最确切的分类号或检索词进行标引,使文献标识对文献主题来说具有尽可能高的专指度。
并列主题文献 见 单主题文献,多主题文献
补充标引 见 标引方式
不合理的组配 在叙词组配标引中,若干词组配起来后在概念上不明确,逻辑上不合理,内容上不科学。总之,不符合一般思维规律。这种组配称为不合理的组配。
部分标引 见 标引方式
部首排检法 简称部首法。汉字形序排检法的一种。按汉字偏旁部位进行字顺排列的方法和规则。汉字的部首无统一标准。此法的规则是:首先确定部首数量,将汉字归入相应部首,同部首的字,按笔画数排列,同部首又同笔画的字,再按一定的笔形排列。
C 参照 又称引见、交互参照。目录和索引中设置的引导检索者参见另一标目或另一部分标目的说明。参照只有标目和说明文字,没有对文献的具体记载,因此不属于款目。参照的作用在于提供给检索者更多的检索途径,显示目录和索引各部分之间的联系,减少不必要的重复,可提高检全率和检准率。参照可分为单纯参照、相关参照和一般参照三种类型。
参照系统 这是主题法系统各种情报检索语言显示概念之间关系的主要方法,即在每个检索词下设立参照项,用参照符号指出该词的等同关系词、上位词、下位词和相关词。一部词表中参照项的总和,构成一个语义网络,称参照系统。
层次结构标识,无层次结构标识 层次结构标识是能分别反映文献主题各构成因素及层次结构的文献标识,如层累制分类号、分段式分类号、多级标题、带说明语的单级标题、叙词先组散组式使用时的标识串等。无层次结构标识是只能从整体上表达的一个文献主题,不能反映其构成因素及层次结构的文献标识。如顺序制分类号、单级标题等。
查字法 见 检字法
抽词标引 不依据词表,直接从文献题名、文摘或正文中抽取关键词进行标引。关键词可以用人工抽取,也可以用计算机自动抽取。抽词标引不如依据词表的赋词标引质量高,但方法简便,标引速度快,特别是可实现标引自动化。
出处,出处项 (1)索引款目所指被索引内容的地址;(2)分析款目中指明的来源文献。
传统检索设备 主要指卡片目录和书本式目录这类检索设备。
词串 由若干个叙词以先组散组式构成的文献标识。词串中的词应符合词序,并应正确使用组配符号进行联接。
词对轮排 见 词对式关键词索引
词频 某个词在文献中的出现次数以及在标引和检索中的使用次数。它能在一定程度上反映该词的重要程度及作为检索词的使用价值。在自动标引中,词频是选择标引用词的重要依据之一。
词素 构成词的成分,在意义上不能再分析的构词单位。词由一个或多个词素构成。词素包括词根、词缀等。有些词只包含一个词素,如“图”、“葡萄”;有些词包含两个或更多的词素,如“图书”、“图书馆”、“葡萄酒”。
词素可倒转的词 在自然语言中,有的词两个词素可以倒转而不变原义(如仔猪和猪仔),两种形式没有严格限制,都可以使用。在情报检索语言中,这类词只能选一个作正式词,另一个可作入口词。
词形 词的书面形式。
词序 (1)指标题词和叙词的正装形式和倒置形式;(2)指叙词型先组散组式文献标识(叙词串)中各个词的次序。
词序控制 使检索词词串(即表达文献主题的句子)符合词序要求。词序控制的重要性在于:(1)处于句首的语词决定着一个文献主题的“检索入口”,也决定着它可以与哪些主题直接聚类;(2)有逻辑性的词序使表达文献主题的语句含义明确,易于理解;(3)有规律的词序可提高标引的一致性;(4)合理安排的词序可用较少的文献款目或索引款目满足大多数检索要求;(5)词序也决定着某个检索词是否属于冗余、堆砌,即当把专指度高的词放在前面时,在它后面的专指度低的词实际上是起不了作用而成为多余的。体系分类法中分类标准的使用次序,组配分类法中的分面公式,标题法中主标题与各级子标题的次序,叙词词语自然词序与倒置词序形式,也都属于词序控制问题。词序应符合逻辑性要求,应反映文献主题诸构成因素的层次性。
词义 语言中词所表示的意义。词的意义是客观事物或现象在人们意识中的概括的反映,是由应用这种语言的集体在使用过程中约定俗成的。人们对词义的相互了解是体现语言的交际功能的重要条件。
词义含糊现象 某些词词义的不明确性。如“大城市”一词到底指多大规模的城市。对词义含糊现象可用加注释或加限定词的方法排除。
词组 按照语法规则组合起来的一组词(其中至少有一个是合成词)。根据词和词之间不同的结构关系,可分为:联合式词组、偏正式词组、主谓式词组、复杂词组和固定词组。
词组标题 见 单级标题
次要主题 见 主要标题,次要标题
次子标题 见 子标题,次子标题,再次子标题
错标 见 标引错误 D
带说明语的单级标题 见 倒置标题,带说明语的单级标题
带限定词的标题 又称限定标题。标题带有置于括号中的限定词,限定词一般表示标题的学科、专业范围或文献类型。
待标概念 见 主题概念
单纯参照 又称直接参照、见参照。反映等同关系的参照,是从非标引-检索用词指向标引-检索用词的参照形式。
单词标题 见 单级标题
单个索引 单功能索引。
单观点标引 见 一维标引
单级标题 仅由一个名词术语构成的标题形式。它可以是一个单词,称单词标题或元词标题(如“肠”),也可以是一个词组,称词组标题或复词标题(如“肠梗阻”)。有些标题系统只采用单级标题形式,其优点是比较简单,缺点是专指性差,在一个标题下往往集中资料太多,不便检索。补救的办法是多用词组标题,以稍增专指度。由上可知,单词标题必定是单级标题,但单级标题不一定是单词标题。
单卷式检索工具 以“书”的形式独立出版的检索工具。此概念与期刊式检索工具(检索刊物)相对。其实,单卷式检索工具也可以是多卷、多册的。
单一标题系统 只使用一种标题形式的标题系统。
单一性检索工具 指仅收录单一文献类型的检索工具。如专利文献检索工具、标准文献检索工具、科技报告检索工具等。
单因素主题 见 文献主题结构类型
单元词 又称元词。单元词检索语言的语词,是一种组配式语词标识,供后组式使用。其特点是绝大部分为单词(单纯词或合成词)。
单元词标引 使用单元词的文献标引。其特点是着眼于对文献的情报内容进行描述,因此主题分析力求全面,标引时多个单元词散列,不构成词串。
单元主题 见 文献主题结构类型
单主题文献,多主题文献 单主题文献是指一文献的内容只论述一个主题。这可以是全面论述一个问题,或对一学科作概述,也可以是只论述一事物的某一方面问题。多主题文献又称并列主题文献,是指一文献的内容论述了两个或两个以上的主题。这可以是同时论述两个或两个以上各自独立的主题,也可以是同时论述相互从属的一个大主题和一个小主题,或者同时论述两个相互关联的主题。
倒算纪年排检法 见 反纪年排列法
倒置标题,带说明语的单级标题 倒置标题又称倒装标题。倒置标题是指采用倒置词序的标题形式。带说明语的单级标题是指由单级标题和说明语共同构成的标题形式。倒置标题与带说明语的单级标题多数形式相同,但倒置标题标题倒置部分仅表示事物的特称,而说明语则既可用于表示事物的特称,也可用于表示事物的方面。
倒置词序 将词组检索词的限定部分倒置于后部,可产生字面成族的效果。例如:
军事心理学 心理学,军事
教育心理学 心理学,教育
司法心理学 心理学,司法
倒置轮排 采用倒置词序的轮排法。
倒装标题 见 倒置标题,带说明语的单级标题
导词 在文献款目标目中处于检索入口位置的检索词。
导卡,导片 见 指引卡
地序排列法 简称地序法。按地理特征(行政区划)系统排列文献的方法。其次序一般与国家行政区划相一致。此法主要用于地理文献、地方文献、农业文献等地区性较强的文献。
地址出处 表示索引款目所揭示的内容其正文所在位置的代码(如页码、文摘号、题录号等)或文字,它是索引与正文联系的纽带和桥梁。
典型主题结构 见 文献主题结构
定型词组 形式已稳定的词组。在标题形式选择中,一般采用正写形式。
定语性质的词 见 具有构词功能的词
堆砌 在叙词标引中使用多余无用的词(冗词)进行组配,称为堆砌。主观上是要完整地表达文献主题,实际上并不能起到使文献标识更专指的作用,却反而造成文献标识不通顺,致使主题概念不能简单明白地表达。例如“敦煌石窟―中国―甘肃”,其中“中国―甘肃”对明确主题是多余无用的。
对口标引 见 标引方式
多层次主题 见 文献主题结构类型
多观点标引 见 多维标引
多级标题 又称复合标题。即带子标题的标题形式,子标题可只有一级,也可以有多级。如“老人问题―美国”、“国际贸易―国际会议―伦敦―1993”。在多级标题中,第一级标题称为主标题,第二级标题称为子标题(副标题),第三级标题称为次子标题(副副标题),第四级标题称为再次子标题(副副副标题)。各级子标题词一般取自子标题表。
多维标引 又称多元标引、多观点标引。对一文献用多个分类号或检索词从几个不同侧面或角度进行标引,适于处理含有复合主题或内容复杂的文献,可产生按不同事物属性或主题因素集中文献,并可产生从不同角度检索到同一文献的效果。
多义词,同形异义词 在自然语言中,多义词仅指一词多义现象,而且在多种意义之间有相关性,即本义与通过引伸本义或用本义作比喻而形成的转义之间的关系。如“渔鼓”一词既指一种乐器,又指一种曲艺(用该乐器伴奏)。同形异义词从形式上看好像也是一词多义现象,其实并非真正多义。犹如同名同姓,两件事物只是取了相同的名称而已。如“杜鹃”一词,一种花和一种鸟都取了这个名称,故又称同形词。在情报检索语言中,同形异义词与多义词对检索效率的不良影响是相同的,所以都把它们作多义词处理。
多因素主题 见 文献主题结构类型
多音字 有些汉字有多个读音,当检索词按音序排列时,产生排检位置问题。如“藏书”(cang)、“藏族”(zang)。
多元标引 见 多维标引
多元词 指由词组构成的检索词。
多元主题 见 文献主题结构类型
多主题文献 见 单主题文献,多主题文献
F
反纪年排列法 又称倒算纪年排检法。时序排检法的一种。指按由近及远的逆时间顺序进行排检文献的方法。可向读者首先揭示最新文献。
反义词,否定词 某些反义词或某些否定词所表达的概念都处于反对关系中,互相排斥,互相否定,但实际上却是从不同角度说明同一问题,因素又互相依存。如“光洁度”与“粗糙度”,“稳定性”与“不稳定性”,“腐蚀”与“耐腐蚀”。在情报检索语言中,此类词一般作为同义词处理。
凡例 书本式目录或索引的编制说明,内容可包括:本目录或索引的用途、收录范围、著录项目、参照系统、格式、排列方法、符号含义、查阅方法、对所用检索语言的详细说明等,必要时可附图例说明。
范围注释 说明标识含义(适宜范围)的注释。范围注释在体系分类法中特别多,在主题法系统的各种语言中也有,但较少见。带限定词的标题,其限定词部分相当于范围注释。
泛指词 见 专指词,泛指词
方面 见 类称,特称,方面
方面词组配 见 概念限定组配
非标题词 标题词语言中的非标引-检索用词(入口词)。
非标引-检索用词 见标引-检索用词,非标引-检索用词
非单元词 单元词检索语言的非标引-检索用词(入口词)。
非关键词 见 关键词,非关键词
非控标引 见 受控标引,非控标引
非叙词 又称非正式叙词、非正式主题词。叙词语言中的非标引-检索用词(入口词),包括叙词规范化处理中落选的同义词和近义词,被合并的和被组代的专指词。
非用词 见 关键词,非关键词
分拆标引 将一个复杂的主题概念分拆为两个或三个较简单的主题概念进行标引,以代替难于标引和轮排的词串。如《氯丙嗪引起粒细胞缺乏症》可标引为“粒细胞缺乏症一致病化学因素”和“氯丙嗪―药物副作用”。
分段式标识 指文献标识具有分段的形式,可以辨别每段所表达的主题因素,某些分段式标识具有便于在每段扩充或进行轮排的可能。采用分段标记法的分类号、多级标题、叙词词串等都是分段式标识。
分段制标记法,分段标记 一个具体类目的分类标记由若干段构成,段与段之间具有层累的性质。至于就一段分类标记而言,可以是一个层累制标记,也可以是一个顺序制标记。分段式标记不但具有层累制标记的优点,而且易于明确类号的涵义(因每段表达一个主题因素),便于在每段扩充,也便于在必要时进行轮排。缺点是标记更长。分段标记形式如:PyQsinUWlce(4段)、9s6rlf/4nm(4段)、K82=49(2段)、TF4(313)(2段)等。
分类标引 又称归类。用分类号表达文献主题的处理过程。分类标引必须依据分类法和分类标引规则。藏书的分类标引包括文献查重、主题分析、给分类号、编制书次号、核查等工序。
分类标引规则 又称分类工作条例。文献分类标引工作所应遵循的规范性准则。内容包括:文献分类标引的基本规则、各种主题文献的分类标引规则、各种类型文献的分类标引规则、各种学科文献的分类标引规则、文献分类标引的工作程序、文献分类标引的质量管理等。
分类标引基本规则 可概括为:(1)文献分类标引必须以文献内容的学科或专业属性为主要依据,并顾及文献类型、特定用途等特点;(2)文献分类标引必须依据文献分类表及其使用规则,辨清类目的确切含义和范围,不能脱离类目之间的逻辑关系和类目注释的限定来孤立地理解类名的意义而进行分类;(3)文献分类标引必须符合专指性要求,即应把文献分入恰如其分的类目,而不能分入范围大于或小于文献实际内容的类目。只有当分类表中无确切类目时,才能分入范围较大的类目(上位类)或与文献内容最密切的相关类目;(4)文献分类标引必须使文献能“尽其用”,即符合实用性要求。应根据文献的具体内容和实际用途,在检索系统中提供必要数量的、切合需要的检索途径。对于涉及多个类目的文献,在大中型综合性图书馆和情报机构的检索系统中,应利用互见分类、分析分类等方法尽可能作全面反映;在小型图书馆的检索系统中,一般可只选择一个主要的类目予以反映;在专业性图书馆和情报机构的检索系统中,可选择其中对本单位读者有用的类目予以反映。若一个文献主题在分类表中设有两个可选择的类目(交替类目)时,专业单位可选用其中一个对本单位更有用的类目予以反映。
分类工作条例 见 分类标引规则
分类号 代表一个类目的符号,简称类号。
分类检索工具 据某种分类体系编制的目录、索引、文摘等。它采取相关排列法按内容组织文献,具有很好的系统性,在检索中能给使用者“鸟瞰全貌”、“触类旁通”的方便,并有宣传、推荐的功能。
分类款目 以分类号为标目的款目,是组成分类目录的基本成分。分类款目可分为主要分类款目、附加分类款目、分析分类款目、综合分类款目几种。
分类目录参照片 见 类目参照
分类书名目录 同类书按书名排的分类目录。这种目录分类比较粗略。
分类主题目录,分类主题索引 又称系统主题目录或系统主题索引,误称主题分类目录。指将带有主题标识的文献款目先按分类排列(一般是粗分类,如按叙词范围分类)排列,再在同一类内按字顺排列的目录或索引。
分类字顺排列法 指将文献款目先按分类排,再按字顺排的排列方法。此法用于语词标识系统,如分类主题目录(一种类似叙词范畴索引的排列方法)。
分散标引 指对构成成套文献(如丛书、有分卷书名的多卷书等)的各个单元分别进行标引。分析标引 把文献的一个部分作为分析款目,针对分析款目的标引。
分析标引误差 见 文献分析标引误差
分析角度 文献主题分析时对文献情报内容及其他特征进行调查、提问的角度。分析角度随文献的学科性质而异,随各单位的具体需要而有所偏重,并受所用情报检索语言的特点所支配。
分析水平 可以从两方面来说明:一方面是指“宏观”的分析还是“微观”的分析,即是以一套、一种、一册文献作为一个单位来进行主题分析,还是以一册中的一篇、一章、一节作为一个单位来进行主题分析;另一方面是指进行概括式的分析还是描述式的分析,是用简单概念来表达还是用复杂概念来表达。
分析误差 见 文献分析标引误差
符号标引 见 主题分析
副标目 标题目录和索引中对标目进行修饰、限定的词、词组或短语等。副标目可以是受控语言,也可以是自然语言。
副标题 见 子标题,次子标题,再次子标题
副标题词 见 子标题词
赋词标引 受控标引的一种。指用词表中的词赋予文献的标引方法。
赋号标引 受控标引的一种。指用分类表中的分类号赋予文献的标引方法。
复词标题 见 单级标题
复分 指在标引时,对某一类目下的文献用复分表、仿分法、主类号直接组配法等进一步细分,或对某一标题下的文献用子标题、说明语等进一步细分。
复合标目 由两个或两个以上的检索词按特定规则组配起来成为一个检索词串,来表达一个复杂的主题概念的标目。
复合标题 见 多级标题
复合主题 见 文献主题结构类型
复杂词组 在其中又包含其他词组的词组。如“国民经济计划指标体系”、“苏格兰文艺复兴运动”。
G 概念标引 见 主题分析
概念分析 与“概念综合”相对。将一个内涵较深的概念(概念因素较多的复杂概念)解析为两个或多个内涵较浅的概念(概念因素较少的简单概念)的一种逻辑方法。如将“35毫米宽银幕立体声彩色艺术电影片”这个内涵较深的概念分析为“35毫米电影片”、“宽银幕电影片”、“立体声电影片”、“彩色电影片”、“艺术电影片”五个内涵较浅的概念。被分析的概念与分析出来的概念具有隶属关系。
概念限定组配 又称方面词组配。这是在一个表示事物的叙词和另一个表示事物某一属性或某一方面问题的叙词之间进行的概念限定的逻辑推演,组配结果所形成的新概念,表示该事物的某一特称或某一方面。概念限定组配占叙词组配的大部分,适用范围包括:(1)事物整体与部分――表示该事物的一个组成部分;(2)产品与材料――表示制造该产品所用的材料;(3)产品与工艺――表示制造该产品所用的工艺;(4)材料与工艺――表示加工该材料所用的方法;(5)产品与设备、或工艺与设备,或研究对象与设备――表示制造该产品所用的设备、或某种工艺所用的设备,或某种研究设备;(6)事物与研究方法――表示研究该事物所用的方法;(7)事物与事物性质――表示该事物的某种性质;(8)事物与事物现象、状态、过程等――表示该事物所具有的现象、状态、发展过程及其原因、结果等;(9)事物与学科门类――表示该事物在某一学科方面的问题,或研究该事物的某种学科;(10)事物与文献类型,或学科与文献类型――表示关于该事物或该学科的某种类型的文献;(11)事物与地区、时代、机构等专有名词――表示该事物的特定地区范围、时间范围、有关机构等。
概念相交组配 又称同级词组配。这是在两个或两个以上具有概念相交关系的同级叙词之间进行的概念相交的逻辑推演,组配结果所形成的新概念,是原来两个概念的种概念。
概念因素 构成一个概念的因素。一个最简单的概念只有一个概念因素(如发动机);一个复杂的概念有多个概念因素(如“飞机发动机噪声”有三个概念因素)。
概念组配,字面组配 概念组配,其实质是概念的分析与综合,即拆义(如“河北地方剧+梆子 河北梆子”);字面组配,其实质是词的分拆与组合,即拆词(如“河北+梆子 河北梆子”),两者在组配准确性上有重大区别。
更新周期 指检索刊物的出版周期及其累积本的出版周期,或文献数据库(磁盘、光盘等)增补一批新记录的周期。更新周期是衡量检索刊物或文献数据库报道速度的指标。
固定标识 在分类表、词表编制阶段对复杂主题概念就一一列出专指的分类号或检索词,在使用过程中基本上不需要进行组配操作的先组式语言的标识。固定标识比较适用于文献单元方式检索系统,它只提供一条固定的检索途径,不可能从任何一个概念因素入手进行检索,缺乏灵活性,但含义相当明确。
固定词组 若干词组合成固定形式的词组。如“人民日报”、“百家争鸣”、“中华人民共和国”。
关键词,非关键词 关键词检索语言(关键词法)的语词。关键词是指那些出现在文献的标题(篇名、章节名)以至摘要、正文中,对表征文献主题内容具有实质意义的语词,亦即对揭示和描述文献主题来说是重要的、带关键性的(可以作为检索“入口”的)那些语词,简称键词。关键词以外的词,称为非关键词。非关键词又称索引不用词、禁用词、停用词、非用词。非关键词虽能帮助描述文献主题,但不起重要作用,不能作为检索入口。关键词法是将关键词不加规范或只作极少量的规范化处理,按字顺排列,以提供检索途径的方法。若干关键词的结合构成一条索引款目,说明一篇文献的主题内容;但全部关键词在系统中却是彼此孤立,而且同义词、准同义词甚至一个词的不同形态都并存,不显示相互关系,按其性质是一种准情报检索语言。
关键词目录 以关键词作为标目的文献目录,关键词由人工指定。
规范档 又称权威档。供对索引用词作规范化处理查考的标引记录。
规范化处理 见 词汇控制
过度标引 简称过标。用过多的分类号或检索词去标引那些无多大价值的文献内容,会造成误检。
过渡词 指叙词先组式标引中使用概括性的词置于专指词之前,形成等级结构,有利于聚类,但不影响专指性检索。如“肺结核―诊断:X线诊断”、“肺结核―诊断:实验室诊断”,其中“诊断”一词为过渡词。 H
含糊抽词 见 模糊抽词
含义明确性 (1)指检索词或类名词是否含义明确;(2)指文献组配标识是否含义明确。
含义注释 又称涵义注释。对词义含糊的检索词所作的定义性注释。如“大城市 注:50~100万人的城市”,“特大城市 注:100万人以上的城市”。
汉语词不同写法 指同一词的两种书面形式:如“渔具”与“鱼具”。
汉语拼音排列法 按汉语拼音进行字顺排序的方法和规则。有字母本位排列法、音节本位排列法、首字母排列法、音节与其他顺序结合的排列法四种,以第四种最为合理。
汉字标识 即汉语检索词。
汉字不同形体 指简体字、繁体字、异体字。在情报检索语言中一般采用简体字,不用繁体字和异体字。
汉字排检法 见 检字法
汉字形位排检法 简称形位法。一种按汉字形体部位结构进行字顺排列的方法和规则,为杜定友所创。此法将汉字分为纵、横、斜、载、覆、角、方、整八种形体,以左方或上方为部首,整字无部首。汉字归入八种形体中的一种,以形为序,同形字以部首为序(部首按起笔点、横、竖、撇为序),同部首者按除去该字部首以外的笔形排列。
汉字字素 见 字素
号码标识 又称分类标记、分类号。是分类检索语言的语词。号码标识由数码、字母等(即标记符号)按照一定的编码方法(即标记制度)构成。号码标识编码时可服从于反映概念等级体系的要求,因此能按知识分类体系(事物和学科的分类体系)组织情报,具有很好的系统性。
宏观分析,微观分析 宏观分析是指以一套、一种、一册文献作为一个单位来进行主题分析;微观分析是指以一篇、一章、一节作为一个单位来进行主题分析。
后组式标识 后组式语言的标识。
后组式标引 使用组配式情报检索语言标引文献时,不将标引结果组配成标识串,而是供检索者在检索时根据需要临时进行组配的一种标引方式。
后组式文献标识 即待到检索时才根据检索要求组配起来的文献标识,这种类型的文献标识能够回答任意的检索提问。
互见 见 附加分类号,附加分类款目
回溯性检索工具 揭示、报道过去特定时期内出版的文献的检索工具,供人们对已积累的文献进行回溯检索。
混合标题系统 采用不只一种标题形式的标题法系统。其优点是可以提高检索效率,查找比较方便,但结构复杂,编制标题表和编制检索工具都较难。
混合标引 又称半控标引。一般指在主题标引过程中同时使用人工语言(主题检索语言)和自然语言,即当词表中有合适的词时,就使用词表中的词标引,否则就使用自然语言词标引。 J
机辅标引 见 计算机辅助标引
机检标引 用于计算机检索的标引,即数据库标引。其特点(主要指叙词标引的特点)是:(1)进行深度标引;(2)可使用自由词作补充标引;(3)使用关联符号将标引用词分组;(4)加工生成主题目录或主题索引款目用的标题符号;(5)使用标引工作单。
机助标引 见 计算机辅助标引
集中标引 通过集中编目、协作编目等形式提供分类号和检索词。集中标引好处在于:(1)可避免重复标引,节约人力;(2)可使情报检索语言及其使用法趋向统一,方便检索;(3)有可能更深入细致地进行标引;(4)有可能提高标引的准确性。集中标引必须仔细考虑每一篇文献的多方面用途,必须照顾到各个学科、专业的需要,并且必须保证质量。集中分类 以文献分类标引为内容的集中标引。
计算机标引 利用计算机进行文献标引,包括自动标引和计算机辅助标引。
计算机辅助标引 简称机助标引或机辅标引。由计算机从文献篇名、文摘或正文中自动抽出关键词,供标引人员鉴别;或者由计算机对标引人员选定的标引词构造出各种可能有用的标识串,供标引人员选择;或对标引人员输入的不规范词进行换词,等等。
纪年排检法 见 时序排列法
加权标引法 见 加权检索法,加权标引法
加权检索法,加权标引法 “权”是表示重要程度的数值。加权检索法是对布尔逻辑检索法的改进,其具体方法是对参加组配检索的各个标识依据检索要求分别给予表示不同重要程度的数值,标识的不同组合可按权值的大小进行排队输出。加权检索法可细分为两种:(1)对检索用词加权,这是从文献主题对检索课题的相符性方面进行排队,即将检出文献按表示相符程度的权值排序输出,排在前的文献是最切题的文献;(2)限权检索,即对检索用词进行加权,并且对检索结果设置一临界值加以控制,在临界值以上方可输出。加权标引法是对标引用词进行加权,实质也是为了加权检索,只是在标引阶段即进行加权而已。加权标引法也可细分为两种:(1)对标引用词加权,即表示某篇文献对某标引词来说的重要程度,也就是揭示文献讨论的重点;(2)对文献加权,即表示某篇文献的一般重要程度。
间接标引 见 直接标引,间接标引
间接款目 见 直接款目,间接款目
见参照 见 单纯参照
检索标识 简称标识。情报检索语言就其实质来说是表达一系列概括文献情报内容的概念及其相互关系的概念标识系统。表达文献情报内容的概念标识,是情报检索语言的语词。它不仅是情报检索语言发挥第一项基本功能的工具,而且也是情报检索语言发挥其他三项基本功能的基础。情报检索语言使用的标识可分为号码标识,语词标识和代码标识三类。
检索词 又称标引词。主题法系统各种情报检索语言语词的统称,是标题词、单元词、叙词(主题词)、关键词的上位概念。
检索词位置 指语词标识串轮排中,某个词排到作为检索入口的位置。一个词处于这个位置时,可以对它进行检索,一个主题也才能以这个词为核心与其他主题聚类。
检索点 用于查找和识别一条文献记录的名称、术语、代码等,具有检索和识别一条文献记录的功能。文献检索标识(赋予文献的分类号、检索词等)是检索点的重要组成部分。
检索工具 主要指书本式和卡片式的目录、索引、文摘等供手工检索用的载有文献信息的检索设备。
检索工具评价标准 可概括为:(1)对所报道范围内文献的摘贮率;(2)文献选择水平;(3)对所收录文献的有序组合水平;(4)检索途径的完备程度;(5)报道时差;(6)检索工具编制水平。
检索刊物 又称索引刊物、索引期刊、期刊式检索工具。以期刊形式出版的目录、索引、文摘等检索工具。是书本式检索工具的主要类型。
检索入口 (1)指检索词串或分类号串的前端;(2)指可进入检索工具或检索系统(数据库)查检文献的一切途径,包括直接途径和间接途径。
检索设备 检索工具和检索系统的物质形式,包括文献信息载体及其容器和使用装置,有书本式检索设备、卡片式检索设备、缩微式检索设备、电子计算机检索设备等。
检索系统 见 情报检索系统
检字表 书本式目录或索引的附属部分,是标目首字的字顺表,指明以某字为首字的第一个标目的页码。一部书本式目录或索引可以有多种检字法的检字表。
检字法 又称查字法、汉字排检法。使汉字的各种目录、索引、辞书条目等便于查检的排列方法。大致可依据字形、读音、字义分为三类。依据字形的检字法有部首检字法、笔画检字法、四角号码检字法等;依据读音的检字法有汉语拼音检字法、韵目顺序检字法等;依据字义的检字法是按字义的分类排列的,现已淘汰。
兼互参照 见 相关参照
减意标引 当一个主题概念难以标引而其中有的概念因素检索意义又不大时,可只标引有检索意义的概念因素,对那些检索意义不大的概念因素不予标引。
键词 见 关键词
交互参照 见 参照
近义词 又称近同义词。意义相近的词。在语言学中归入同义词一类,在情报检索语言中归入准同义词一类。如“谚语”与“格言”就是近义词。
近义词标引 见 靠词标引
局部标引 见 标引方式
局部主题 见 整体主题,局部主题
句式转换 在情报检索语言中,句式转换是指对一个检索语句改变其词序,产生更多的句子,达到从不同角度表达同一文献内容,以增加检索途径,使一个多因素主题能多向成族(多向聚类)和响应多个检索课题。句式转换有轮排、改写、分拆等方式。
句子式主题 以语句形式表达的主题概念,是对文献进行主题分析的直接结果。如“美学在图书馆中的应用”、“情报检索语言的易用性”。 K
卡片式检索工具 又称卡片式检索系统。以卡片(包括穿孔卡片)作为信息载体的目录、索引、文摘等检索工具。
卡片行,卡片列,卡片字段 穿孔卡片上孔眼的横向排列称为卡片行,孔眼的纵向排列称为卡片列,表示一个概念或检索标识的一个或一组卡片列称为卡片字段。
卡片字段 见 卡片行,卡片列,卡片字段
靠词标引 又称靠题标引、近义词标引。当一个概念在词表中不存在专指词,也不可能用组配标引或上位词标引时,在某些情况下可用靠词标引法,即选用相关词进行标引。靠词标引包括近义词标引和转意标引。近义词标引如《清人笔名别号索引》用“笔名,清代―索引”标引;转意标引如《图书注销》这一概念用“图书登记”一词标引,“丑学”这一概念用“美学”或“美学一流派”标引。
靠类标引 指分类表中没有表达某文献主题的专指类目,也不宜分入泛指类目,而将该文献按某种联系分入相关类目。
靠题标引 见 靠词标引
可标引内容 文献中有检索意义的情报内容。一文献的可标引内容是全部标引还是仅选择一部分标引,依具体检索系统所采取的标引政策而定。
款目 按照一定的方法和规则对某一文献的内容特征和外表特征所作的一条记录,是组成文献目录的基本单位。
款目词 在标题表和叙词表的每条词款目中处于为主地位的词,称为款目词。词款目中的其他成分,即参照项(参照系统)和标注项,都是描述款目词的。词款目按款目词排列。 L
类称,特称,方面 事物的类称与特称相对,是属与种的关系。类称是属概念的名称,特称是种概念的名称。所以,事物的特称是指事物的一个种类,如“人字齿轮”是“齿轮”的一个特称。事物的方面是指事物的某一方面问题,如“齿轮铣削”是“齿轮”的一个方面问题。特称与方面不可混淆,如“齿轮的高速铣削”相对于“齿轮”来说是一个方面,而相对于“齿轮铣削”来说却是一个特称。
类目参照 又称分类目录参照片,是揭示类目之间关系的类目注释在分类目录中的表现形式。
类序法 分类排列法。此名词与时序法、地序法、字序法等对应,较多见于档案专业。
离散式检索工具 相对于连续式检索工具而言,其载体是离散的。如书本式检索工具、卡片式检索工具、离散的缩微式检索工具等。离散式检索工具使用灵活,不需要机械设备。
联机标引 在计算机上直接对文献进行标引。一般来说,联机标引使用的是机读分类表或机读词表,可将分类号或检索词“剪贴”到相应字段。
连续式检索工具 相对于离散式检索工具而言,其载体是连续的。如磁带、磁盘、光盘、缩微胶卷等载体的检索工具。连续式检索工具存贮容量大、检索效率高,但需要机械设备,且操作较复杂。
漏标 文献标引时,遗漏文献中有价值的主题概念而未作充分标引。漏标会造成漏检。
轮排法 见 轮排聚类法 M
盲参照 (1)指向分类表、词表、目录、索引中并不存在的款目的参照。如“A见B”,但实际上B并不存在;(2)分类表、词表、目录、索引中缺少反参照的孤立参照。如有“A参见B”,但无“B参见A”。
模糊抽词 又称含糊抽词。一种人-机结合的汉语题内关键词索引的抽词方法,可回避汉语分词难题。具体方法是:用人工在文献题名中插入一个表示该处要轮排的符号,计算机就复制一个条目并按符号排入相应位置。插入多少个轮排符号,就复制多少个条目,轮排多少次。轮排规则与外文题内关键词索引相同。所谓“模糊抽词”,是指只要能分辨出题名中哪个词或词素具有检索意义,也就是可以作为检索入口和能字面成族的,就把它作为关键词排到检索入口位置,而不须再考虑一个词抽到何处结束的问题。
目录 (1)指文献目录。它是一批文献款目的有序集合。它的功能是对文献进行登记,对每一文献的外表和内容特征进行描述和标引、对大量文献进行系统排列,以供检索、识别和确认文献;(2)指记录一些相关事物,并按一定次序编排的清单,即事物目录。如产品目录、矿物目录、文物目录,等等;(3)指书刊前的目次。
目录式搜索工具 又称搜索目录、主题指南(搜索工具)。系将因特网上的各种网站按主题内容组织成分类等级结构。检索者可按它的等级结构逐层深入,直至找到相关的网址,通过其链接访问相应网站。由于目录式搜索工具的标引工作是由人工来完成的,加之它通常只标引主页,它的数据库比索引式搜索工具的要小得多,故其检索结果的相关度较高。
目录组织 把编好的目录卡片(款目)按一定的规则组织成目录,使之成为一个文献信息逻辑系统的工作过程。一般包括目录内部款目的排列、目录的装饰、目录的维护等内容。
目录组织法 将款目组织成为目录的具体方法和规则。每种目录都有特定的组织法。(未完待续)