・国外索引与文献数据库事业・
如何利用原有书后索引编制新索引
皮特罗尼 邹文钧译
(美国索引家学会) (复旦大学图书馆 上海 200433)
作为美国索引家学会的成员,我一生的职业生涯中,大多时间担任自由索引员。期间,我也当过计算机程序员。多年的努力使我找到一种结合索引和编程两个领域的捷径。可以说,索引的任务是计算机处理能力与软件逻辑自然的应用。
因工作关系,我常与不同的出版商,尤其是教材出版商打交道。这些出版商都出版精心编制了索引的图书,并不断出新版本。因新版本的文本内容有增删、变动,原有索引的页码往往对不上号,需要不断出新索引。
鉴于索引工作劳动量非常之大,老版本索引能用则用。这就牵涉到如何利用原有书后索引问题。这说起来容易做起来难。利用原有索引的做法并不省钱,但可节省时间,并保持索引的质量。
利用原有索引或翻译索引之前,有必要评估一下是否值得去做。应就以下四个方面,做好测试评估工作:
1.检查索引的内部连贯性(如对照参照的准确性等)
2.检查索引的拼写、示位及描述准确性。
3.检查索引所需主题是否缺失。
4.判定索引是否协调一致,确保索引中没有不相干的著录。
总体说来,如索引不是95%完美,就很难再利用它。即便如此,在页码或描述不那么好用的情况下,仍可使用原有的术语。例如,利用特别的索引程序前置功能。当你打入ind字符时,就能带出index,indexer,indexing,索引员可从中选择合适的词。
那么如何获取原有索引中的数据呢?计算机出现前,自然是手工操作,先将原索引复印放大数倍。接着索引员就1,2,3,或10,20,30地查看每个页码。这种方法费时费力。而今,可扫描原有索引,也有了高质量扫描方法,但仍必须仔细核对。除了上述扫描方法之外,还可直接把索引重新打入特定的索引程序。再有就是利用编辑提供给索引员的word文档。最理想的是获取数据库文档,这样可进行全文检索、变动和排序等。
有些书后索引使用段落号码(如1.123)代替页码,这些段落号码在图书出新版本时不变。这种情况下,索引翻译过来重排一下就行了。多数情况下,图书因文本内容有增删、变动,页码也会随之变动。这样,必须把它一项一项搬到新索引中去。我发明了一种称为Deal'm,像玩纸牌一样的程序,用于把原有索引中的数据搬到新索引中去。
总之,在任何情况下,索引员都必须仔细阅读新全文,决定须索引什么,用什么术语,然后查看老索引是否已有此术语。这对确保检查和利用原有索引十分有用。
翻译索引是利用原有索引的极端例子。源语言中的词翻译成目标语言之后,仍有必要分析数据,编制一个可检索、编辑、排序和编排的数据库(字顺,或其他排序)。因语言的哲学不同。可以想见翻译的索引会传递与原语言不同的印象,这是因为词汇和句法不同。
下面通过介绍一本书索引翻译过程,介绍翻译索引大致所要经历的10个步骤。这本书是用英语、西班牙语和汉语出版的“纽约移民指南”(均为单卷本)。出版商是纽约时报报社和移民博物馆。
1.首先,由我编制英文书的英文索引。这按通常方法处理。
2.我把编制好的英文索引以word格式提交给专业的翻译公司。英文索引看上去像这样:
Absence from work,pay deductions for,26(旷工,减薪,26)
Abuse,physical and sexual,69(虐待,身体与性,69)
Accountant,for taxes,27(会计,税务,27)
Address:change of,86-87;proof of,36,42(地址:变更,86-87;证实,36,42)
3.我指示公司译员通读word文本。每个英文词组前他应附上西班牙文翻译,并由标点隔开。
4.索引中有的行是不用翻译的。如:Banco Popular,302(人民银行,302),因为西班牙文中已有此银行的名称。
5.从译员处得到扩展的文本,通过英文西班牙文比较核实译文的正确性(这意味着我要读懂西班牙文)。
6.接着,我从文本中除去英文(自动处理),只剩下西班牙文。
7.接着分析(扩展)数据。按页码编排参照,变更西班牙文中用的页码。重新编页后,以西班牙文重新按字顺排列全部索引数据,并编辑。
8.对照西班牙文文本,校对西班牙文索引,尤其核对页码(西班牙文译文需要多页数,页码有所不同)。同样,如译成中文,页数变少,页码也不同,需仔细校对。
9.按字顺重排,得到西班牙文文本的索引。
10.作进一步编辑修改,编成西班牙文索引,以word格式提交给出版商。
我相信,利用原有索引与翻译索引是十分有趣的领域,必将有所发展。此文只能抛砖引玉,以期与同仁探讨。
皮特罗尼 美国索引学会资深索引专家。
邹文钧 复旦大学图书馆副研究馆员。