网络环境下索引产品扩展策略探讨
何绍华1 朱红涛2
(1广东商学院广东省电子商务市场应用技术重点实验室 广州 510320)
(2武汉大学信息管理学院 430072)
摘 要 文章总结了网络环境下索引产品的加工对象和服务对象――信息资源和用户发生的变化,在分析这种变化给索引产品带来的机遇和挑战的基础上,探讨索引加工对象扩展、索引服务对象扩展、传统索引产品扩展等网络环境下索引产品的扩展策略。
关键词 索引产品 网络环境 扩展
信息技术的迅速发展与网络技术的迅猛发展与广泛普及,极大程度地提高了信息的生产、分布和分配,并从根本上改变了用户获取信息的方式。索引作为信息加工和重组的一种形式,以及提升用户获取信息效率的重要工具和途径,如何通过变革迎接和适应网络环境下信息资源及用户信息获取方式变化带来的挑战,值得业界关注和研究。在此总结网络环境下信息资源以及用户信息获取方式的变化,分析索引面临的机遇和挑战,提出针对性的索引产品扩展措施。
1 网络环境下索引产品面临的新变化
索引是将信息集合中具有检索意义的事物名称及形式或内容特征词(如篇名、人名、书名、网站名、网页名、地名、主题词、分子式、分类号、专利号、报告号、名词术语)等信息单元抽取出来,其后注明地址,按照特征词字顺进行重组排序所形成的信息存取系统[1]。它是链接信息资源和用户的桥梁,其功能是为了提高用户信息和知识检索速度和效率,信息资源和用户是索引产品的两个终端,信息资源和用户的变化对索引产品的形式和功能具有重要影响。而网络技术、信息技术的变化以及网络的普及已经使网络信息资源和用户发生了根本变化。
1.1 网络环境下索引处理对象――信息资源的新变化
与传统的信息资源相比,网络环境下信息资源有以下几个变化:
图1 2006.12-2010.06中国网站规模变化[3]
(1)数量巨大
根据瑞典互联网流量监测机构Pingdom公布数据显示,截止2009年9月,全球互联网网站数量已达到2.34亿个,比2008年同期增加4700万个[2],而中国互联网络信息中心2010年发布的第26次《中国互联网络发展状况统计报告》显示,截止2010年6月底,中国的网站数,即域名注册者在中国境内的网站数(包括在境内接入和境外接入)为279万个,2003年至2010年我国互联网页增长情况如图1所示[3]。
信息资源数量的这种高增长丰富了用户所需的信息来源,为用户提供了强大资源支撑,但同时巨大的信息量增加了用户信息获取的难度,致使出现“信息爆炸”时代的“信息贫乏”现象,这种现象促使加强索引工具与产品的研究与开发,提升网络信息资源序化程度,为用户提供有效的信息检索和获取途径。
(2)信息资源内容更加广泛
网络环境下的信息资源大多表现为数字化信息,而信息技术的发展使得信息资源的量通常不再受限于载体的容量,同时,网络环境下信息的交互性、信息生产、传播、利用的大众化使网上信息资源涵盖了几乎所有范畴,既包括专业性知识如天文、地理、军事、医学等,也包括了音乐、生活、休闲、交通等其他知识,已经形成了包罗万象的“信息海洋”。
(3)信息污染严重,质量良莠不齐
网络环境下信息资源数量巨大、内容广泛,一方面为用户提供了更为广泛的信息资源支撑,另一方面信息垃圾、信息污染问题已经不容忽视。同时,当前网络信息资源的结构多样、标准不一、信息处理方式差异等状况,使得信息资源杂乱无章、序化程度较低,由于信息生产人员的广泛性、普遍性和多样性,也导致网络信息资源质量的良莠不齐。
(4)网络环境下信息更新速度快、时效性强
与传统的纸质信息资源相比,网络环境下信息生产、加工、传递、信息交流更为方便,信息流通速度和更新速度加快,生命周期缩短,使得信息时效性更加突出。如有的网页信息每天更新,有的网页信息周更新。
1.2 网络环境下索引服务对象――用户的新变化
网络环境下,索引服务对象――用户的数量、用户的职业范围和知识水平、用户需求等各方面都发生了重大变化。
(1)用户的数量和范围发生了变化
索引产品的传统用户一般限于纸质信息资源的索引用户,其数量比较有限,而随着网络的普及网络信息用户数量迅速增长,索引产品的现有及潜在用户数量将大幅增长。截止2010年6月底,我国总体网民规模达到4.2亿,突破了4亿关口,较2009年底增加3600万人。互联网普及率攀升至31.8%,较2009年底提高2.9个百分点[3]。而获取信息已经成为用户上网的重要目的之一,索引作为人们获取信息的重要工具和途径,将受到用户重视和青睐,因此网络用户可以看作是索引产品的现有或潜在用户。
(2)用户的知识水平和职业范围发生了变化
索引产品的传统用户通常是具有一定知识水平的人员,如研究人员、企业知识技能人员等,而网络环境下信息用户则包括了各类知识水平人员,涵盖了从小学及以下、中学到本科、博士等各个层面知识水平人员;同时用户职业范围分布广泛,包括学生、个体户/自由职业者、农林牧渔劳动者、无业/下岗/失业、农村外出务工人员、产业服务业工人等各类人员。
(3)用户信息获取需求变化
网络环境下用户获取信息的习惯、要求都有了很大变化,网络的虚拟、繁杂使用户获取信息时对准确性、效率、获取的内容范围、获取的信息形式、获取工具的易用和实用性都有了更高的要求。例如网络环境下用户对获取信息的形式要求,从传统环境下单一的信息形式如文本信息、影音信息、视频信息等,转而希望获取反应某些内容的各种形式的信息集合;网络环境下,由于用户自身的多样性导致其需求内容的多样性和广泛性,其获取的信息内容已经不仅仅局限于医学、制造、管理等专业性信息,而可能扩展至养生、休闲、购物、旅游等类型的信息内容。
2 网络环境下索引产品面临的机遇和挑战
如前所述,网络环境下索引产品的加工对象和服务对象已经发生了很大变化,这些变化给索引产品的发展带来机遇的同时,也带来了严峻的挑战。
2.1 网络环境下索引产品面临的新机遇
网络环境下信息资源和用户的变化给索引产品的发展带来了更加广阔的发展空间,为索引事业的进一步发展提供了良好机遇。网络环境下信息资源数量的急剧增加、内容范围的扩大为索引产品提供了更为丰富的加工对象,为索引产品的扩展、衍生提供了更多的机会和素材,索引产品的加工对象将从传统的纸质资源扩展到数字化信息资源,从专业性知识信息扩展至包括生活、保健、交通、饮食、旅游等各类信息,这为索引的可持续发展提供了广阔前景。
同时,网络用户的迅速增加也将使索引产品的现有用户及潜在用户数量迅速增加,为索引产品乃至索引事业的发展提供了强大的发展动力。信息检索和获取是网络用户网络信息活动的重要内容和目标之一,作为提高信息检索效率并为用户提供信息获取工具和途径的索引产品极有可能成为网络用户的使用对象,索引产品作为致用性事物,与其需求紧密相关并受需求驱动,用户数量的增加及其需求的扩展将推动索引新产品的研究和开发,促使相关主体根据用户的需求变化提供种类更多、质量更高的索引新产品。
2.2 网络环境下索引产品面临的挑战
网络环境下索引产品的加工处理对象得到了迅速扩展,包括了各类信息资源,然而数量巨大且杂乱无序、质量良莠不齐、信息的快速更新将给索引产品加工带来巨大的挑战。索引的基本原理是以揭示具体信息线索,显示单一的概念、事实、数据等与特定的信息现象或实体集合之间的联系为目的而制作的信息记录,每一索引记录单元由索引标目项和出处项组成[4]。对于网络信息来讲,索引标目项可以是一切可供检索的对象,网页标题、关键词、产品名称、公式、人名等等,信息形式可以是词语、代码、图形或图像,甚至音频等;出处项即是所揭示信息的定位标识,它指明标目项的出处或存贮地址,如链接网址。而网络信息资源的质和量现状将给索引产品标示提取、标记等工作带来巨大的工作量,同时网络信息资源的快速更新也对索引产品提出了更高的要求,使得网络信息资源的索引产品的内容和网址也必须随着网络信息资源的更新不断进行更新,以保证其标目项和出处项的准确性、新颖性。
另外,网络环境下用户知识水平参差不齐、用户职业种类多样化也给索引产品的加工带来不少挑战。不同知识水平和职业种类的用户,其网络信息资源的获取习惯、信息理解能力、信息行为能力通常有较大差别,这要求索引产品的开发除了具有一些通用的功能外、还必须考虑用户信息获取的个性化特征,根据各层次、各类型用户的实际情况,设置其功能、界面和信息获取的操作方式。
3 网络环境下索引产品的扩展策略
3.1 索引产品扩展中的创新策略
索引是适应用户信息资源检索和查询需求的产物,随着网络环境下用户需求、用户特点、信息资源、索引技术等的变化,索引产品的发展必须坚持创新,不断开发出适应网络环境的新产品。索引产品扩展中的创新包括索引理念创新、索引基本理论创新和索引技术创新等几个方面。索引理念创新主要指要以动态和发展的眼光看待索引基本概念、范畴、功能定位、使用对象等问题。在网络环境下,索引不再仅仅局限于对图书、报刊等信息的处理,而可以包括网络环境中的生活类、娱乐类、旅游类等各类信息资源;索引的功能也不仅仅限于科学研究的需要,而是针对信息获取的需要;其用户也将从研究人员扩展至网络环境下的各类信息用户。
其次是索引基本理论创新,主要是指索引产品的功能、形式、结构、方法等方面的创新。网络环境下信息分布、存储、获取、传递的方式都有了很大变化,传统环境下索引产品的标引项和出处项结构已经不能满足网络环境信息标引的需要,因此需要对索引产品的各个特性进行创新和变革。如索引项将从人名、地名、机构名为主要索引对象的索引,逐渐扩展至包括企业名、网站名、地名、酒店名、商场名、分子式、常用词、基本词汇等代表网络用户信息获取对象的基本词汇。而索引的结构也从以线性为主的索引结构逐渐扩展为通过链接进行关联的线性、并列和网状等多种结构形态。
第三是索引技术的创新。计算机技术、信息技术的快速发展对索引技术的发展起到了重要推动作用。早期的索引产品由手工编织而成,20世纪中期,英国的Crestadoro率先利用计算机编制了题内关键词索引(KWIC),此后机编索引逐渐得到广泛应用,机编索引的最终形式通常是我们所熟知的索引数据库,包括主题索引、人名索引、题名索引、颜色索引、社会科学索引等各类数据库[1]。就中文信息资源的索引技术方面,索引自动化、智能化方面已经取得了一些成果,如自动标引、自动抽词、自动分词等,但这些成果的精准度以及这些成果的产品化和普及应用程度尚需进一步提高。
3.2 网络环境下索引加工对象和服务对象的扩展
网络环境下索引的加工对象――信息资源的种类、范围和数量都发生了巨大变化,因此需要根据网络环境下信息资源的现状以及用户对其需求状况扩大加工对象。传统的索引产品加工对象主要包括专业性、知识性较强的信息资源,如书刊杂志、企业信息、报告信息等等,而当前网络环境下,信息资源的范围则扩展至生产、生活、娱乐等各个领域,且用户对该类信息的获取需求日益旺盛,因此,在进行索引产品开发和加工时,应考虑将其加工对象和范围扩展至既包括专业性、知识性信息资源,也包括生活、娱乐休闲、保健、理财、交通、购物等多种信息资源,要有全面的信息资源观,尽可能整合和处理网络各类信息资源,以满足更为广泛的信息资源需要。
其次是索引产品服务对象的扩展。传统的索引产品服务对象主要包括具有一定知识水平的人员或职业,如科研、教学、技术人员等,而随着网络环境的普及大众信息意识逐渐增强,信息获取成为大众化需要,网络用户已经涵盖了包括小学及以下至博士研究生等各个层面知识水平的人员,因此索引产品的服务对象也应该根据用户范围的扩展而扩展。这要求在进行索引产品开发时,要顾及各类人群的需求,根据用户的不同设计不同的索引界面、索引工具、索引项,同时允许用户根据自己的习惯和使用需求定制和设置索引产品界面、索引项、结果显示详尽程度、显示方式等,以适应不同知识层次用户信息和知识获取能力,满足各类用户个性化信息获取需求。
3.3 网络环境下传统索引产品的扩展
传统索引产品,如纸质报刊索引、图书索引等在用户传统信息获取过程中起到了重要作用,网络环境下这些传统索引产品的延伸和扩展能够更好地满足网络用户使用需求。网络的普及使相当一部分用户信息获取方式和习惯发生了变化,因此,网络信息源与纸质信息源同样重要,甚至超过纸质信息资源,成为用户获取信息的重要来源,原有的各类纸质索引产品尽管存在价格优势、阅读方便等优点[5-6],但仍不能满足用户网络信息获取方式的需求,因此可以考虑将传统纸质产品扩展至光盘版、网络版等多种形式,同时利用现代信息技术增加各种页面链接,如果可能,也可直接索引地址链接指向具体信息页面,以适应用户远程获取、即时获取、快速查询、关联查询等信息获取习惯变化,满足网络环境下用户信息资源获取的各种需求。
网络环境下信息资源和用户的变化对索引产品提出了更高的要求,如何推进索引产品变革,适应当前的需求形势值得关注。文章分析了网络环境下索引加工处理对象和服务对象――信息资源和用户的新变化,以及索引产品面临的机遇和挑战,探讨了网络环境下索引产品的扩展策略,为索引行业的进一步发展提供参考。
参考文献
1 张帆.信息组织学[M].北京:科学出版社,2005:174-175
2 经济新闻.2.34亿全球网站数量[N/OL].南方都市报,2010-01-27(GC11). [2010-8-21].http://gcontent.oeeee.com/8/34/834520f1cd753417/Blog/3b6/fd043a.html
3 中国互联网络信息中心.第26次《中国互联网络发展状况统计报告》[R].[2010-8-15].http://research.cnnic.cn/html/1279171593d2348.html
4 储节旺,郭春侠.索引法在网络信息组织中的应用[J].情报杂志,2000,19(6):94,96
5 王英智,张文.网络环境下书本式《全国报刊索引》的生存与发展[J].情报资料工作,2003(5):65-67
6 何涵慧.网络环境下报纸索引生存问题的探析.农业图书情报学刊[J],2007,19(9):120-123,130
何绍华 博士、教授,武汉大学博士生导师,广东省电子商务市场应用技术重点实验室研究员,全国文献工作标准委员会统计与绩效评估分委会委员,中国标准化学会资深委员。
朱红涛 武汉大学信息管理学院博士研究生。