搜索引擎之我见 陈 湘
发布时间:2018-09-25  浏览次数:4

搜索引擎之我见

 

(福建省图书馆福州 350001

1  搜索引擎对生活、学习的影响

随着新理论、新方法以及新技术的广泛而深入的应用,现代索引技术得到了快速的发展,在社会的日常生活、学习和科学研究中日益发挥着不可或缺的重要作用,并逐步取代传统的索引技术而成为处理信息的主流工具,特别是搜索引擎正日益成为信息世界整序与利用的最主要的工具。

索引发展至今已成为了一个庞大的体系。除了传统的书目索引、黄页等,更发展到现代化的引文索引、数据库索引以及搜索引擎,带给人们更加丰富多彩的生活、学习环境。人们更多地依赖于现代化的手段来获取信息,利用信息。

我在大学时代就学习、应用过CAEI等世界上影响最大的多种国际性检索工具,并利用这些工具为用户服务。工作后曾经使用传统的索引,如《全国报刊索引》等,现在为用户查寻信息服务则更多地是使用数据库和搜索引擎,亲身体验到现代索引技术的日新月异,以及它带给人们的高速度、高效率的生活与学习环境,充分体验到它对社会发展所带来的巨大影响。在我的工作历程中最突出的有二个例子。

1:公历二月为什么只有28天?查阅回答这类问题,一般须要利用到百科全书和有关历法的知识图书,查阅起来相当费工夫和精力。而利用搜索引擎,在检索栏中轻松地填入“228天”即可查寻到有关28日设置的由来,以及儒略历与奥古斯都历的有关知识,就能够快速地、全面地解答问题。

2:“蓝孔雀,绿孔雀”的养殖,在检索栏中填入“蓝孔雀,绿孔雀”就可以获得大量的有关蓝孔雀,绿孔雀养殖场所、种苗基地、加工基地等大量的信息,同时也包含了许多不相关有关孔雀的文学作品信息。

上述二例,使我对搜索引擎在处理信息上的效率和影响有了深刻的印象和感想。

2  搜索引擎的足与不足

网络信息的迅猛发展,日益丰富着人们的生活,人们在生活、工作、学习中遇到的问题,日趋依赖于网络来解决。但网络信息在促进人们生活、学习效率大幅度提高的同时,网络信息的海量性、繁杂性和多结构性,也带给人们查寻信息的困扰,使人们产生了严重的“信息焦虑”。因此大幅提高信息的查寻效率,成为迫切的问题。而通过搜索引擎可以大量地、准确地、快速地获取信息,能够较好地满足人们一般的信息查寻需求,能够大量地节省时间和精力,获得事半功倍的效果。

再次,搜索引擎改变了人们学习、生活的行为方式。由于搜索引擎在信息查询的准确性、快速性和有效性方面有较大的优势,使人们传统的信息浏览方式将成为过去,人们对传统纸质的文本依赖性逐步减弱,信息的即时查询,信息的网络查询、分析与利用日渐成为人们学习、生活的一个重要环节。

现代的搜索引擎技术正深入到人们的生活、学习的各个角落,并深刻地影响着人们生活、学习的方式和效益,促进人们生活、学习方式的现代化转换。

然而,当前,搜索引擎技术与方法仍不是完美的,距离人们的理想状态还存在着一定的距离。特别是搜索引擎是采用简单的字形匹配,在智能方面,在自然语言处理、语义网技术处理方面,在索引自动处理方面,仍存在着较多问题,仍存在着信息冗余、信息检索不精准等问题。许多问题目前尚在研究过程中,在当前并不能做到准确化和智能化。因此在目前的条件下,我们则应该较好地掌握搜索引擎的检索方法,大力地提高检索技术,提高信息的分析与处理能力,尽可能地发挥专业人员的知识水平,以提高用户服务的水准。

3  展望

通过工作中的信息查询与服务,我认为今后的搜索引擎发展方向,应特别注重以下三个方面的发展,才能够更好地发挥搜索引擎的信息处理与利用能力。

3.1  提高短词组、短语的处理能力

在目前技术条件下,只有提高检索技能,充分发挥搜索引擎在搜集信息、利用信息上快速、全面的特点,不断提高应用水平,特别是利用现代索引技术对于自然语言的处理能力,尽量利用短词、短语等,才能够更好地提高信息查询的效率。

短词组、短语检索实际上是将自然语言中的语句,分解为多层次的语义结构网,处理为短语检索式,作为入口词进行检索,充分借助计算机在字形匹配的快速运算能力。如上例中“二月为什么有28天”这一检索命题,可以简单地处理为“二月28天”这一语义短语检索式,就能够快速、直接地获得准确的信息回馈。在搜索引擎检索上使用短词组、短语检索比代数运算检索式更有效率。

32  发展智能与学习型的搜索引擎

随着网络的普及,用户个人利用网络自行查询信息变得越来越普遍,通过专业人员的中介而进行的信息查询将趋于减弱。普通用户由于专业背景及知识能力的不同,使用的自然检索用语、习惯方式以及对信息理解、选择、分析的素质不同,因此在利用网络搜集、利用信息存在着较严重的缺陷,使得发展智能型的有自我学习机能的搜索引擎变得重要而迫切。

智能型的搜索引擎应该对使用自然语言的检索具有一定的处理能力,如截词、词组、词组组合、检索范畴的限定、词组之间的语义关联、各种跨数据库跨语言系统的处理能力,以及异形同义词、同形异义词的区别和缩扩检的能力等等,才能够在聚类与专指上大大地提高,使检索更加准确、全面和高效率。学习型的搜索引擎则须要对用户的检索有一定的记忆、学习和推理的能力,使用户的检索不断地调整、深入、准确,能够多角度、多方位地理解用户的检索目的,推理用户的检索方法。目前许多搜索引擎在自学习技术上有了一定的改进和提高。比如输入“网上卡拉OK”检索词,搜索引擎即可推理出多种的相关主题词索引,如“卡拉OK、网上唱卡拉OK、网上卡拉OK大比拼”等多个检索途径,以满足用户不同的信息检索需要。

今后,可发展一种客户终端检索器,它具有记录用户检索的功能,以及推理和学习的处理能力,当用户再次检索同样问题时,能够准确提供检索方案,供用户参考和使用。

33  增强互动功能

由于电脑网络与人们的日常生活、学习日益紧密相关,日常生活信息需求繁杂,具有多种类、多层次、多角度的特点,信息查询就显得复杂。而相当一部分用户不具有专业背景,对于搜索引擎的使用也不够熟练,在搜索日常生活信息时,就存在着较多困难,因此就需要搜索引擎具有较强的互动功能,使用户在检索信息过程中能够不断地调整检索方法和路径,在信息反馈中不断发出询问,再选择,再检索,直到获得准确的信息为止。

因此,搜索引擎具有良好的互动机制,对满足社会用户需求具有重大意义,它与学习型的功能构成搜索引擎的二大智能支柱。

 

参考文献

1耿骞,刘畅.基于短语结构索引的自然语言检索.现代图书情报技术,20042

2耿骞,汤艳莉.面向自然语言检索的短语结构索引.中国图书馆学报,20042

 

  福建省图书馆副研究馆员。