西文书后索引的结构与组织综述(弗朗西丝·伦尼著 伏安娜译)
发布时间:2018-09-26  浏览次数:52

西文书后索引的结构与组织综述

 

弗朗西丝·伦尼  

(美国索引协会)

 

伏安  

(复旦大学图书馆  上海   200433

 

前言

图书索引的编制与期刊、连续出版物、和资料集的索引编制不同。这些连续的、开放的索引系统使用关键词来捕捉文献的重点,且通常存储于网上的或是图书馆的数据库中。用关键词检索数据库能引导研究者前往源文献和数据库以外的文献。对于收藏品,数据库记录可涵盖除实物以外所有相关的研究内容。

数据库中的信息是不断发展的,且通过受控词表来选择和控制关键词。相较之下,书是一种独立的信息单元(封闭式的索引体系),读者希望能从中定位到他们寻找的信息。它不能引导你前往其它有相关信息的地方。此外,书通常都有一个中心思想,所以读者查询的信息往往非常明确。这些信息可能包含了一章,或者是一章中的一节,一个段落,甚至仅仅存在于几个句子中。

因此,编撰书后索引的标引人员必须阅读、分析书中的主要内容,探究各主题间的联系,预估该书的使用定位(所针对的读者层次),以方便读者查询和阅读的方式来呈现这些概念和关系。为实现这一基本要求,标引人员力求整合相似的主题与款目,为读者提供导航性帮助(交互参照),以一种直观的、始终如一的格式来组织索引。

标引人员呈现给读者的条目必须既反映文本的自然语言,又体现他们所预测的、现读者可能切入文章的用语。

索引的编制

通过使用副标目和交互参照来体现关系与联系:

1.1副标目

索引中的副标目从属于主要款目(主标目),说明探讨主题的背景,或是与主要款目间的关系。

多数出版商通常规定只能有一级副标目,但一些学科领域却需要深入的分析。例如在医学文献中,一个带有三级副标目的主标目是非常常见的。如:

    Main term (heading)

       Subheading level 1

          Subheading level 2

              Subheading level 3

一些法律索引可能需要更加深入的分析

1.2交互参照

交互参照是对读者的导航性帮助,引导他们从一个款目(“非偏好”款目:通常是读者偏好而作者不常使用的术语)前往另一个类似的、作者偏好使用的条目(“偏好”款目)。

交互参照主要有三种形式:

“见(see)”参照——指引读者从索引中的非偏好款目到偏好款目

“参见(see also)”参照——让读者知道索引中有相关的主题

“一般(general)”参照——引导读者使用更加确切的条目来切入

索引的编排

西文中的标准排序方法是拉丁字母表顺序法(a-z),主要有两种规则

1) 逐词按照字母顺序排序——依次考察单词中的每个字母,直到出现空格,再从下个单词开始。这种排序方式被广泛应用于面向大众的(非学术的)一般非小说类作品中。该方法易于阅读,便于将相似款目分组。

2) 按照字母顺序逐字母排序——忽视词间空格,只考虑每个字母,将每个条目看作一个长单词。当标点出现时,排序重新开始。人文和科学领域的学术出版商偏爱这种按字母编排的方式。

有时选择不同的字母排序法可能造成索引款目排列顺序的巨大不同,有时不会,完全取决于文献的题材和索引款目的属性。为读者选择最好的排序方式是索引编制人员的责任,这有时甚至可能要求标引人员故意不按顺序排列款目,从而保证款目不被读者忽视。

2.1特殊字符/标音字符

在排序工作中,带标音符号的字符通常被作为基本英语字母处理。但是,在几种情况下存在例外。例如,挪威语和丹麦语中的ø位于z之后,瑞典语中的ä排在z之后。获取专门的详细说明,可查阅不同语言的排序规则。

2.2标题与名称中的定冠词

英语中的单词“the”在索引编制中被进行特殊处理。当作为出版物(图书、期刊文章、电影或艺术品)标题的起首词时,“the”被忽略不计。

当使用非英语格式的“the”(如,La, Le, El, Das)时,特别是在名称中,遵循编制索引所使用语言的相应规则。标引员对人物姓名的格式与编排存有较大争议,但关于名称处理的最佳依据应当是:

    Indexing Names, Edited by Noeline Bridge (American Society for Indexing 2012)

按照字母顺序排列的这类款目并不像初看时的简单和直观,因此标引人员人员要遵循的首要原则就是按照读者希望的方式来放置。

2.3标目起首处的介词/虚词

副标目同样是按照字母顺序排列在主标目的下方。副标目的位置取决于其主要内容。用来说明背景或关系的介词(如:in, on, of)和虚词(如:and, about, following),在排序时忽略不计。

索引的格式

3.1索引文字

最常用的索引格式是缩进式。读者可以通过标目和相关副标目来定位合适的切入口,进行快速跳读,它对于许多数学科都是行之有效的。但这种格式只适用于需要深度分析的情况(即有多于一个的副标目)。

然而,一些学科的文字内容从本质而言是非常叙述性的,副标目很长且为描述性语言,嵌入式(段落式)能更好的呈现它们。这种格式常常在讲故事为主的传记类、历史类著作中见到。传记类和历史类索引还有另一个特征,它们的副标目可以不按照字母顺序排列在主标目下方,而是按其在书中的位置来编排。这被称作按时间顺序排列,主要遵循文中的时间脉络。

3.2页面参照项/出处项

尽管可能指引读者前往完全不同的位置,但“页面参照项(page references和“出处项(locators)”通常可以替换使用。出处项可以是一个页码、段落编号、行序号,或者在法律文献中,也可以是某个法规的章节号。

出处项同样可以按照不同的格式编排。可以放在标目或副标目右对齐文字的旁边,使所有的数字排放成垂直的一列。

页面参照项和出处项的不同格式也能为读者提供一些信息,例如在某页有插图、图表,或是有脚注、尾注。在字数较多的副标目中,一个不同字体的出处项也能为读者在寻找的切入点提供有效的指引。

索引标准、惯例、范例和资源

索引方面的国际标准组织文件《Information and documentation–Guidelines for the content, organizationand presentation of indexes(ISO 999, 1998(E))》是索引编制规范和范例的主要权威依据。它提供索引编制、款目格式、字母顺序排列操作和常见缩写方面的指导。

例如,其中有关于如何处理“St.saint打头名字的具体说明。在索引中,“St.”将按照saint排列,但st开头的单词除外。同样的,苏格兰姓氏中的“Mc”,按照“Mac.”处理。

在美国,芝加哥大学出版社于2010年出版的《The Chicago Manual of Style: The Essential Guide for Writers, Editors, and Publishers》第16版是编辑和索引工作者们公认的权威,它常被称作CMS。其中关于索引编制的章节内容详实,覆盖了ISO999相同的资料。随着版本的不断更新,CMS与不断变化的语言用法与时俱进,有时还提供一些对现有排序方法的重新解读。关于索引的章节也可以单独获得:

l  Indexes: A Chapter from The Chicago Manual of Style, 16th ed. (University of Chicago Press 2010)

为编制准确、有效、易读的索引,美国索引学会(ASI)近期编写了《Indexing Best Practices Guide》。指南的概述部分进一步阐明其目标是为承认文字、学科、索引用户的多样性,来提供一种非严格规定的、具有通用性参考指南。目前,ASI成员正在审核该指南,在充分收集和采纳各方意见后,该指南将被ASI董事会发布采纳。

还有一些知名的业内人士著录了索引编制的相关书籍。近期出版的四个权威著作是:

l  Indexing from A to Z, 2/e, by Hans H. Wellisch (H.W. Wilson 1996)

l  Indexing Books, 2/e,  by Nancy C. Mulvany (University of Chicago Press, 2005)

l  Indexing: The Manual of Good Practice, by Pat F. Booth (K.G.Sauer 2001)

l  Facing the Text: Content and Structure in Book Indexing, by Do Mi Stauber (Cedar Row Press 2004)

另有两本杰出的操作指南:

l  Handbook of Indexing Techniques: A Guide for Beginning Indexers, 5/e,  by Linda K. Fetters (Information Today, Inc., Medford NJ, 2013)

l  The Indexing Companion, by Glenda Browne and John Jermey (Cambridge University Press, 2007)

索引样式中的国际差异

值得一提的是,美国出版者有时会采用一种略微不同的方式来编排索引。以上文中提到“St.”“Mc”的规则为例,欧洲出版商将依照ISO999,但美国出版商却不一定如此,尽管CMS也给出了同样的建议,但索引员可能被要求按照st“mc”的书写方式来排序。这样的推断主要是基于索引条款应当按照读者希望查询的方式来排放的理念。在针对大众(非学术)读者的非小说文献中,读者可能确实希望按照实际书写的方式来查询索引条目。一位非常了解索引规则的研究人员,可能会将“St.”“Mc”按照“Saint”“Mac”来查询。

ISO 999还建议,除一些专有名词(名称)以外,所有的标目都以小写字母开头。但在美国,除了一些针对世界范围内读者的学术出版商,大多数的美国出版商都倾向采用大写字符作为标目的开头。

索引编制软件

书后索引编制人员了解编制规则,并且对何时需要变通规则来更好服务读者有着自己的认识。自八十年代中期,三种单击索引编制软件(CINDEX™, Macrex, SKY™)出现,并成为西文索引编制的主要工具:从书写索引条目,到编辑索引,再到索引文档的排版。每种程序都吸收了标准制定组织和权威机构的最新意见,并且调整了编码来方便文档格式的顺利转换。这将索引员从枯燥的手工编制和排版工作中大大解放,使他们能够集中精力来分析和选择,使读者收益。

近两年里,Cindex已经能够依照公认的排序规则,自右向左,编制非西文索引了。

网络和电子出版物索引

网站的索引或是发布在网站上、可浏览的电子出版物索引的出现已有相当长的一段时间了。电子索引与纸本索引的差异主要在于它的获取是通过点击链接来实现,而不用翻动实体的页面。此外,它对于索引的长度也无限制,而这正是纸本标引人员的一个常见难题。

电子书和其它电子出版物索引的出现较新。尽管由于价格昂贵、“全文检索就足够”的看法、以及直到最近才有了关于电子书索引编制通用规则等这些原因,这种索引仍未被广泛应用,但ASI目前已有了12本电子书有配有内容标签格和方便导航的索引了。

关于最新通过的EPUB3索引规则,请访问国际数字出版论坛(International Digital Publishing Forum)网站http://www.idpf.org/epub/idx/,获取电子书为何能从索引中获益的执行摘要,请见http://www.levtechinc.com/pdf/ExecutiveSummaryForPublishers.pdf

结语

演讲的开始,我曾谈到数据库索引和书后索引的本质区别。两种环境下,索引人员所付出的智慧劳动是一样的,但成果却不相同。影响终端用户的一个明显差异是,关键词检索数据库通常会产生一些可能性的结果,需要研究者进行进一步的评估。如果操作正确,书后索引可以引导读者迅速前往获得他们所需要的信息。

在使用拉丁字母的语言中,索引编制遵循着一系列规则来规范书后索引的格式,使那些认为各种索引结构都相似的读者能够自由地穿梭于各种书中(语言中)。然而,我们不应低估索引人员在语言和组织方面的创造力,他们有能力让读者使用自己的语言,尽可能无缝、有效地切入文献中。

 

弗朗西丝·伦尼(Frances S. Lennie 女,曾任职于美国索引协会理事会,在2003200420102011届任期内,担任美国索引协会主席。

 

伏安  1989生,硕士,现为复旦大学图书馆助理馆员。