我国内容索引研究主题与研究热点的可视化分析*
赵蓉英1,2 吴胜男1
(1 武汉大学信息资源研究中心 430072)
(2 武汉大学科学评价研究中心 430072)
摘 要 以CNKI收录的与内容索引高度相关的文献题录信息为数据样本,利用信息可视化软件Citespace与数理统计软件SPSS对所采集的数据进行共词分析与聚类分析,展示了内容索引研究的时间分布以及期刊分布,并绘制了相应的知识图谱,剖析了内容索引的研究主题,揭示了我国内容索引研究的热点领域。图4,表4,参考文献17。
关键词 内容索引 研究主题 研究热点 可视化分析
Abstract: Based on research papers of content index from CNKI, this paper uses Citespace and SPSS to conduct coword and cluster analysis. This study identified the distribution of issuing time and the representative journals. Meanwhile, this paper got the knowledge map of content index to analyze the research theme and reveal the hot topics of context index in China.4 figs. 4 tabs.17 refs.
Keywords: Content Index; Research Theme;Research Focus;Visual Analysis
内容索引,是将图书、论文等文献中包含的事物、人名、地名、学术名词等内容要项摘录下来而成的索引。它常附于年鉴、手册、专著等的后面,也可以单独成书。是帮助查找文献中各项知识的有效工具[1]。内容索引研究既是一个具有悠久历史的传统学术领域,又是一个充满创造性的崭新研究领域。随着科学技术的发展以及网络时代的来临,内容索引的研究内容和方法以及发展方向都发生了深刻的变化。
本文以CNKI收录的与内容索引高度相关的文献为数据来源,利用信息可视化软件Citespace与数理统计软件SPSS对所采集的数据进行了共词分析与聚类分析,展示了内容索引研究的时间分布以及期刊分布,剖析了内容索引的研究主题,揭示了我国内容索引研究的热点领域,旨在全面把握我国内容索引研究发展的动态过程,特点以及规律,窥见我国内容索引的研究现状,同时为推动我国内容索引研究的发展,为促进相关学科如知识组织,信息检索的进一步繁荣开辟更广阔的空间,这也是本文的研究意义以及动力之所在。
1 数据来源与研究方法
1.1 数据来源
本文的分析数据全部来源于中国学术期刊网络出版总库平台(中国知网),英文缩写为CNKI(NATIONAL KNOWLEDGE INFRASTRUCTURE),经过多年的发展,CNKI已经成为目前世界上最大的连续动态更新的中国期刊全文数据库。为了增加数据的检全率以及检准率,本文最后确定的检索策略为:主题=“内容索引”OR 题名=“内容索引”OR 关键词=“内容索引”。然后对得到的数据进行过滤清洗,如去除年鉴、文摘、会议通知等非研究型文献,最后得到与内容索引高度相关的文献214篇。
1.2 数据的预处理
本文在做研究主题分析时,采用的是关键词共现的方法。由于关键词是未经规范化处理的自然语词,因此需要我们进一步对它们进行相应的清洗,具体步骤如下:(1)舍弃,舍弃无实际研究意义的关键词,如 “重要作用、必要性、必然趋势、本质意义、重要内容研制成功”等;(2)合并,合并关键词中的近义词,如“索引编纂、索引编制、索引汇编、编制索引”等均以“索引编制”表示;(3)集中,将一些反映特定内容的关键词集中用其上位词代替,如“图书馆学专业、图书馆学研究、图书馆事业”均以“图书馆学”表示。
1.3 研究方法及工具
本文所采用的研究方法是文献计量与内容分析法。文献计量法是利用数学、统计学等计量方法,研究文献信息的增长、分布、结构、交流和利用的数量关系,进而研究科学文献信息的结构、特征和规律[2]。内容分析法是一种对研究对象的内容进行深入分析,透过现象看本质的科学方法。应用这一方法,对文献的特定主题内容进行定性和定量剖析,可以提取该主题内容的实质,系统、客观地把握其研究动态和趋势[3]。
本研究所使用的分析工具是SPSS和Citespace。SPSS是一款统计分析软件,本研究主要是利用其因子分析以及多维尺度分析的功能对我国内容索引的研究主题进行分析。因子分析,它要实现的目标是用尽可能少的因子来描述尽可能多的指标、因素及它们之间的关系,其基本思想是把研究对象的变量基于关键词间的相关性进行分组,使不同组间变量的相关性较低,而同组内变量的相关性较高。每组变量视为一个公共因子,这样就可以用较少的几个公共因子来反映原始数据的大部分有效信息。多维尺度分析,它是分析目标对象相似性及差异性的一种多元统计分析法,其目的是将词汇间的语义距离尽可能利用二维或三维的空间距离来表示,这样就可以通过直观的视觉来找到研究领域客观存在的通用属性。Stress和RSQ属于对多维尺度分析信度与效度的估计值,其中Stress是拟合度的量值,其值越小表示结果的拟合度越好,一般值在0.20以内是可以接受的;RSQ值则越大越好,一般值在0.60以上是可以接受的[4]。
Citespace是陈超美教授用JAVA语言编写的基于共词分析的引文可视化软件,它可以通过主题词出现的频率, 确定内容索引的研究热点,并绘制出相关的科学知识图谱,从而形象地展示出内容索引研究的热点领域。
2 我国内容索引研究的时序分布
某领域的论文在时间上的分布在一定的程度上反映了该学科领域学术研究的理论水平和发展速度[5]。本文对CNKI收录的与内容索引高度相关的文献进行了统计,并作出了内容索引年度发文量的折线图(由于2012年数据不全,本文暂不统计)。
从图1中可以看出,内容索引研究文献各年的起伏较大,但是呈现逐年上升的趋势。总体来说,大致可以分为三个阶段:①第一阶段:1979年-1997年。各年的相关文献在5篇以内,成为内容索引研究的起步阶段;②第二阶段:1998-2006年。1998年可以看做内容索引发文量的拐点,是内容索引研究的转折期。在这一阶段,虽然各年的发文量起伏较大,但是与上一阶段相比,发文量已经有了一定程度的提高,该阶段可以看做内容索引研究的发展阶段;③2007年-2011年。从2007年起,发文量有了较大幅的提升,直到2008年达到了发文量的顶峰,近几年,内容索引研究的发文略有下降。这一阶段关于内容索引基础理论的研究在减少,而对内容索引的技术及应用的重视程度却在逐年增加,这也在另一方面印证了内容索引的研究在走向成熟。在未来几年,预计内容索引相关的研究论文数量还会增长,内容索引将成为一个研究热点。
图1 内容索引年度发文量折线图
3 我国内容索引研究的期刊分布
经过统计发现,与内容索引高度相关的文献发表在约30种期刊上。为了更清楚的展示出我国内容索引研究期刊分布的特点,笔者将相关期刊按照学科进行了分类,具体结果如下表所示。
表1 我国内容索引研究期刊分布的学科分类
所属学科 | 期刊名称 |
索引学 | 中国索引、中国索引学会论文集 |
图书情报学 | 大学图书情报学刊、江西图书馆学刊、情报科学、情报资料工作、山东图书馆学刊、图书馆、图书馆建设、图书馆界、图书馆理论与实践、图书馆杂志、图书与情报、现代情报、信息系统工程 |
计算机科学 | 福建电脑、互联网周刊、计算机学报、微电脑世界、微计算机信息、 微计算机应用、现代电子技术 |
教育学 | 北京理工大学学报、北京林业大学学报、合肥工业大学学报(自然科学版)、内蒙古师范大学学报(哲学社会科学版)、宿州学院学报、 武汉大学学报(人文科学版) |
出版学 | 辞书研究、科技与出版、中国出版 |
如表1所示,从期刊分布的学科分类来看,除了索引学的期刊外,绝大多数与内容索引研究相关的文献都发表在图书情报学领域的期刊上,其次是计算机科学、教育学以及出版学领域的期刊上。由期刊分布的学科分类特点得知,中国内容索引研究非常注重学科之间的引进和融合,尤其是与图书情报学科的融合。例如,许多论文将本体、主题地图、元数据等图书情报领域的研究成果作为一种理念引入到内容索引方法的研究中,从一种全新的视角来研究内容索引方法;此外,从计算机类的期刊发表内容索引相关文献可得知,我国内容索引的研究领域和应用范围正在逐步扩大,且研究非常注重对新兴事物的结合。例如,对3D、图像、视频等索引的研究,不仅丰富了索引领域的研究和应用,对这些新兴事物的发展也起到了很大的促进作用[6]。
4 我国内容索引研究主题分布
研究主题是某个学科领域主要研究内容的反映,本文主要运用共词分析方法分析内容索引的研究主题。共词分析方法属于内容分析方法的一种,其原理是:当两个能够表达某一学科领域研究主题或研究方向的专业术语(一般为主题词或关键词)在同一篇文献中出现时,表明这两个词之间具有一定的内在关系,并且出现的次数越多,表明它们的距离越近、关系越密切[7] 。
学术期刊论文包含着某一时期某领域最前沿的研究内容,而关键词则是论文核心内容的浓缩,一篇论文通常包含两个以上的关键词,而同一篇文献中出现的两个关键词因反映该文献的研究内容,存在着某种联系。基于文献关键词的共现关系,同时运用因子分析、聚类分析与多维尺度分析等方法,可以得到某个领域的研究主题[8]。
4.1 因子分析
本文从CNKI收录的与内容索引高度相关的文献中提取出关键词,共得到798个关键词,经过使用前文提到的预处理方法以后,最后得到725个有效的关键词。然后将得到的有效关键词按照频次进行排序,提取出前46位关键词(也就是频次大于3的关键词)作为高频关键词, 构建46*46的关键词共现矩阵,然后导入统计软件SPSS进行因子分析与多维尺度分析,以便绘制我国内容索引研究主题知识图谱。
本文对该矩阵进行了因子分析,利用最大方差法进行正交旋转,萃取出14个主成分,解释的总方差显示,14个主成分累计贡献达81.481%(见表2)。本文对14个主成分进行深入分析得知,至少包含一个以上载荷值大于0.5的因子的主成分共有10个,按照因子负载超过0.5 的因子才被接受提取关键词的原则[9] ,本文最终保留前10个主成分,累积贡献达69.237%,并根据所包含的关键词对这10个主成分进行了命名(见表2),10个主成分命名如下:1.文献书目索引;2.图像索引和视频索引;2.计算机辅助下的索引4.语义索引;5.索引工具; 6.数据库;7.多媒体标引与索引;8.索引款目;9.索引目录;10. 网络检索。
表2 我国内容索引研究主成分列表
成份 | 主题名称 | 初始特征值 | 旋转平方和载入 |
合计 | 方差的 % | 累积 % | 合计 | 方差的 % | 累积 % |
1 | 文献书目索引 | 7.239 | 15.736 | 15.736 | 7.239 | 15.736 | 15.736 |
2 | 图像索引与视频索引 | 3.977 | 8.645 | 24.381 | 3.977 | 8.645 | 24.381 |
3 | 计算机辅助下索引 | 3.484 | 7.573 | 31.954 | 3.484 | 7.573 | 31.954 |
4 | 语义索引 | 3.392 | 7.373 | 39.328 | 3.392 | 7.373 | 39.328 |
5 | 索引工具 | 2.791 | 6.068 | 45.395 | 2.791 | 6.068 | 45.395 |
6 | 数据库 | 2.302 | 5.004 | 50.399 | 2.302 | 5.004 | 50.399 |
7 | 多媒体标引与索引 | 2.181 | 4.742 | 55.141 | 2.181 | 4.742 | 55.141 |
8 | 索引款目 | 1.997 | 4.340 | 59.481 | 1.997 | 4.340 | 59.481 |
9 | 索引目录 | 1.757 | 3.820 | 63.301 | 1.757 | 3.820 | 63.301 |
10 | 网络检索 | 2.730 | 5.936 | 69.237 | 2.730 | 5.936 | 69.237 |
11 | | 1.697 | 3.690 | 72.927 | 1.697 | 3.690 | 72.927 |
12 | | 1.559 | 3.389 | 76.315 | 1.559 | 3.389 | 76.315 |
13 | | 1.312 | 2.852 | 79.167 | 1.312 | 2.852 | 79.167 |
14 | | 1.065 | 2.314 | 81.481 | 1.065 | 2.314 | 81.481 |
经过进一步分析发现,有4个关键词横跨两个主成分,且表现为它们分别在两类因子的载荷系数绝对值都超过0.5。因子“条目标题”同时包含在主成份“文献书目索引”与“索引款目”中;因子“语义”包含在“图像索引与视频索引”和“语义索引”中;主成份“计算机辅助下索引”与“索引目录”同时包含因子“目录”;因子“多媒体数据库”同时包含在“数据库”以及“多媒体标引和索引”两个主成分中。
表3 因子分析确定的我国内容索引研究主题
1文献书目索引 | 2图像索引与视频索引 | 4语义索引 | 7多媒体标引与索引 |
因子名称 | 负载 | 因子名称 | 负载 | 因子名称 | 负载 | 因子名称 | 负载 |
中国大百科 全书 | 0.823 | 图像检索 | -0.74 | 语义 索引 | 0.517 0.783 | 多媒体数据库 | -0.54 |
工具书 | 0.586 | 基于内容的 检索 | -0.62 | Lucene XML 图书馆学 | 0.525 0.555 0.522 | 8.索引款目 |
汉语拼音 | 0.819 | Web | -0.94 | 5.索引工具 | 条目释文 | -0.53 |
分类目录 | 0.908 | MPEG | -0.80 | 图书内容索引 | -0.67 | 条目标题 | -0.55 |
文献 | 0.519 | 语义 | -0.54 | 软件类别 | 0.518 | 9.索引目录 |
条目标题 | 0.536 | 3.计算机辅助下的索引 | 索引款目 | -0.54 | 目录 -0.52 |
文献检索 | 0.528 | 目录 | -0.66 | 索引软件 | -0.74 | 10.网络检索 |
文摘 | 0.610 | 计算机辅助 标引 | 0.520 | 6.数据库 | 对等网络 | 0.557 |
中文工具书 | 0.829 | 科技情报 中文分词 | 0.690 0.533 | 多媒体数据库 数据库 | 0.557 0.582 | P2P | 0.641 |
4.2 多维尺度分析
为反映关键词间按意义分布的形态, 也为了进一步验证上述结论, 本文通过多维尺度分析对高频关键词分布加以检验, 并对结果予以可视化表示。本文通过SPSS 统计软件Scale 功能中的多维尺度分析功能(multidimensional scale,ALSCAL), 对我国内容索引研究领域的高频关键词进行二维尺度分析。选用Euclidean 距离,得到该数据压力系数Stress=0.11609,判定系数RSQ=0.98017,均达到满意的效果,选择二维分析组图输出如图2。
图2 我国内容索引研究主题知识图谱I
从知识图谱中可以明显地发现,内容索引,图书馆学这两个关键词在欧式距离上远远偏离其他的关键词,这是由于内容索引与图书馆学所代表的是内容索引的基础理论研究,而除此之外的关键词均隶属于表征内容索引理论应用范围的关键词,因此它们之间具有较多相关性,能够达成很好的融合。
为了能够更加清晰和直观地展示关键词的位置,选用Chebychev 距离,得到如下类似“去中心化”的椭圆轮廓的二维分析组图。
图3 我国内容索引研究主题知识图谱II
我国内容索引研究主题知识图谱显示(见图3),我国内容索引主要可分为4个主题:①内容索引的基础理论及传统应用; ②计算机辅助下的索引;③语义索引、数据库、图像索引以及索引技术;④信息检索与视频检索。
⑴内容索引的基础理论及传统应用。从研究主题的知识图谱中显示,研究主题1包含着高频关键词“内容索引”,但是由于本研究对数据进行了预处理,将“内容索引”“内容索引的功能”“内容索引的功能推广”等关键词集中为“内容索引”。所以关键词“内容索引”代表的意义非常广泛,包括内容索引的定义、功能等基础理论研究。张琪玉老师曾经在他的研究中提出是否可以把“内容索引”作为“图书内容索引”的简称的讨论,并且径直以“图书内容索引”作为其专著的书名,并以解释方式对它作出如下界定:图书内容索引以一书所讨论的各个局部主题和所涉及的具有信息价值的各种主题因素为索引对象,可比图书章节目录更深入地揭示图书内容,并向读者提供与该书章节目录系统不同的内容查检途径[10]。在内容索引的功能上,许多学者都做了大量的研究,但都是仁者见仁,智者见智,还没有形成一个统一的说法。在这一方面,比较有代表性的有苏凡,他将内容索引的功能概括为五个方面:通过选择部分内容发挥阅读指南的作用,查询特定事项的作用,集中主题内容的作用,代替工具书查找专业术语的作用,语言学、文学分析、编纂辞书等科研工具的作用[11]。在这一研究主题中大量包含着高频关键词“中国大百科全书”、“百科全书”、“中文工具书”,这些关键词主要表征的是内容索引在传统环境下的应用成果,其主要研究的是中国大百科全书、百科全书、中文工具书等这些著作的索引的编制以及对其索引的评价和介绍。
⑵计算机辅助下的内容索引。索引工作的现代化实质就是索引编制和使用的计算机化,用计算机编制索引是索引技术发展的高级阶段,在信息技术发达的国家,各种索引都利用计算机编制。随着科学技术的发展以及计算机应用的普及,讨论计算机辅助下的内容索引的论文增长迅速,说明索引界的研究越来越与时俱进。曾蕾[12]、郭丽芳[13]介绍了国外微机辅助索引编制的两大类软件:一类是专用微机辅助索引软件,如直接输入索引款目和款目出处的Macrex、CINDEX、SKY和在电子文档上标引获得款目出处的TExtract;一类是内含索引编辑功能的文字处理软件,如“Microsoft Word”软件,DEXter,emDEX,IndexAssistant,IXgen,WordE-mbed等。此外,侯捷、王彦祥等在计算机辅助下的内容索引的编制中做过一定的探索。
⑶语义索引、数据库、图像索引以及索引技术。语义索引是近年来逐渐兴起的不同于关键词检索的搜索引擎解决方案,在网络与信息技术高速发展的今天,仅仅对目标进行存储和基于关键词的检索是不够的,还要满足用户对数据的内容进行语义分析,以达到更深层次的检索,它的检索结果更接近人的自然语言,在一定程度上提高检索结果的相关性,目前已逐渐应用到图书馆、数据库和搜索引擎的算法当中[14]。海量网络信息的环境下,信息检索和索引方案的研究是当前研究的热点,索引的研究已经向实用性、新颖性和广泛性的方向发展。
数据库的检索其实是索引原理的新发展,其在功能上相当于传统索引的一个索引体系,但比传统索引有更多的检索功能,是一种更高级、更先进的索引,它提高了索引的质量,加快编制的速度,使得索引的更新十分容易,并且实现了检索自动化,提高了检索的速度和效果[15]。
随着多媒体技术和网络技术的发展,信息检索方式由传统基于关键词或描述性文本的检索,走向根据描述对象内容的各种特征进行检索,融合了图像理解、模式识别和计算机视觉等技术,能够满足用户对图像等新型信息形式的检索。
信息量的迅猛增长以及计算机的广泛应用,新的索引技术应用到索引领域中,如WEB服务的广泛应用使XML类型的数据成为运用最普遍的数据形式, XML索引技术能加强XML的搜索查询效率,因此XML文档及XML数据的检索技术也就成为了索引研究者关注的焦点。
⑷信息检索与视频检索。当今之社会,信息发展势如破竹,网上信息良莠不齐、鱼龙混杂。视频技术随着信息技术的发展已经发展为普通人记录生活和娱乐的一种手段。同时网络技术的发达也促使视频以串流媒体的形式存在于因特网之上并可被电脑接收与播放。因此,人们比以往任何时候都更迫切需要对包括视频在内的各种信息进行整序,以克服由于信息的无序、离散和无节制增长而造成的查找和利用上的困难。对视频和信息进行描述、甄别、组织、整合和有序化,形成各种类型的索引和数据库,并进一步建立高效的视频和信息检索和利用机制,成为了时代赋予索引业的新的使命[6]。
5 我国内容索引研究热点分析
研究热点是在某一时间段内,有内在联系的、数量相对较多的一组论文所探讨的科学问题或专题。从文献计量学的角度看,在某学科领域内被引频次最高的研究型文献通常是该领域研究热点的集中体现[16]。关键词在一篇文章中所占的篇幅虽然不多, 往往只有3- 5个, 但是作者对于文章核心的概括和精炼, 是一篇文章的精髓。因此对文章的关键词进行分析, 频次高的关键词常被用来确定一个研究领域的热点问题[17]。
将CNKI收录的与内容索引高度相关的文献数据按照被引频次进行分类,选出前50篇高被引文献,导入到citespace中,网络节点选择关键词(keyword),同时选定名词短语(noun phrase),并选择合适的阈值,运行citespace软件。最后得到我国内容索引研究热点的知识图谱(图4)。同时导出CiteSpace中的数据整理出内容索引研究热点的信息(表4)。
图4中每个圆形的节点代表关键词, 节点的大小代表该关键词出现的频次, 节点越大这个关键词出现的频次越多, 表明其为内容索引的热点领域。从图4中可以看出,我国内容索引研究热点可以划分为四个时间段:① 1990年-1994年;②1995年-1999年;③2000年-2004年;④2005年-至今。
图4 我国内容索引研究热点知识图谱
表4 我国内容索引研究热点信息统计表
频次 | 年度 | 热点词汇 | 频次 | 年度 | 热点词汇 |
18 | 1993 | 内容索引 | 9 | 2002 | xml |
4 | 1993 | 条目释文 | 3 | 2002 | 视频检索 |
3 | 1993 | 检索系统 | 4 | 2004 | 对等网络 |
11 | 1996 | 索引 | 4 | 2005 | p2p |
3 | 1997 | 百科全书 | 3 | 2005 | 信息检索 |
3 | 1997 | 分类目录 | 4 | 2008 | 图书内容索引 |
5 | 2000 | 多媒体数据库 | 4 | 2008 | 相似度 |
5 | 2000 | 基于内容检索 | | | |
⑴1990年-1994年:在这一个时间段内,突增的关键词是内容索引、条目释文以及检索系统。其中出现频次最高的关键词是内容索引。“内容索引”这一关键词代表的是内容索引的理论研究,“条目释文”这一关键词也是表征内容索引的理论研究,而在1993年,检索系统出现的时间不长,对于其索引功能的探讨也是停留在理论探索阶段。从前文对于内容索引研究的时序分布的分析中可知,1990年-1994年这一阶段是内容索引研究的起步阶段,而理论研究作为一个学科的基石, 一直以来都是一个学科在起步阶段的研究核心, 内容索引也不例外。所以在这一阶段,内容索引的研究热点是对于其理论基础的研究。
⑵1995年-1999年:在此阶段内,突增的关键词为“索引”、“百科全书”以及“分类目录”。众所周知,内容索引是索引的一个分类,因此关键词“索引”仍然代表的是内容索引的理论研究。而“百科全书”,“分类目录”表征的是内容索引的传统应用研究。这说明在这一阶段,内容索引的研究热点发生了迁移,人们的关注热点逐渐从理论探讨转移到了应用研究。
⑶2000年-2004年:此阶段突增的关键词为“多媒体数据库”、“基于内容的检索”、“XML”、“视频检索”、 “对等网络”。这些关键词都是表征网络环境下内容索引的应用。随着多媒体技术和网络技术的发展,信息检索的模式由传统的基于关键词的检索转向了基于对象内容的检索,同时随着信息量的迅猛增长以及计算机的广泛应用,新的索引技术应用到索引领域中,如WEB服务的广泛应用使XML类型的数据成为运用最普遍的数据形式, XML索引技术能加强XML的搜索查询效率,因此这些理应成为内容索引在这一阶段的研究热点。
⑷2005年-至今:“P2P”、“信息检索”、“图书内容索引”、“相似度”是这一阶段突增的关键词。由这些关键词可以明显的看出,这一阶段的研究热点是信息检索。目前是一个信息爆炸的时代,人们由于信息的无序、离散和无节制增长而造成的查找和利用上的困难,如何对信息进行描述、甄别、组织、整合和有序化,形成各种类型的索引和数据库,并进一步建立高效的信息检索机制,理应成为内容索引研究在这一阶段的研究热点。
6 研究结论
以CNKI收录的与内容索引高度相关的文献为研究对象,利用信息可视化软件Citespace与数理统计软件SPSS对采集的数据进行了时序分析、期刊分析、研究主题与研究热点分析。基于以上研究分析,本研究认为我国内容索引研究呈现出如下的特点:
⑴研究领域广泛,研究内容系统。从我国内容索引的研究主题来看,国内对于内容索引的研究比较全面,涉及到了方方面面。从基础理论到方法、技术、工具再到其应用,都有大量的相关研究,而且每个方面的研究都比较的系统。
⑵注重实践和应用研究。在研究主题的分析中,笔者发现,研究主题1,研究主题3以及研究主题4都是对于内容索引的应用研究。这说明实践与应用研究已经成为了内容索引研究中的重中之重。而且,随着科学技术的进一步发展,笔者推断,内容索引的应用研究会进一步的深化和系统化。同时,应用研究的深化将成为一种推动力去促进内容索引理论与技术的进一步发展。
⑶注重吸收相关学科的理论成果, 重视与新兴事物研究的结合。从我国内容索引研究的期刊分布角度来说, 大多数的文献都发表在图书情报领域的期刊上。这说明我国内容索引研究非常重视学科间相互吸收和融合, 注重吸收相关学科的理论成果来扩展自己的研究, 为研究增添新的活力。同时, 我国内容索引研究也非常注重新兴事物的研究, 如数据库、 视频、 图像等等, 我国的学者将视角转移到对数据库、 视频和图像的索引研究, 不仅丰富了索引领域的研究和应用, 对这些新兴事物的发展也起到了很大的促进作用。
⑷研究热点经历了由理论研究向传统应用研究再到网络环境下的新应用研究的迁移。基于内容索引研究热点的知识图谱分析,我国内容索引研究热点经历了两次转变:①由理论研究向传统应用研究转变;②由传统应用研究向网络环境下的新应用研究转变。这是因为在不同时代环境下,内容索引面临的发展需求不同,根据不同的发展需求产生相应的研究热点,说明了内容索引研究的与时俱进。
*基金项目:本文为国家社科基金重大项目“基于语义的馆藏资源深度聚合与可视化展示研究”(11&ZD152)的研究成果之一。本文得到School of Information Sciences, University of Pittsburgh的大力支持,在此谨表示感谢。
参考文献
1 百度百科. 内容索引[EB/OL]. [2012-07-18].http://baike.baidu.com/view/1373196.htm
2 邱均平.信息计量学[M].武汉:武汉大学出版社,2007
3 邱均平,谭春辉,文庭孝.2004年国内外情报学研究重点及其演进[J].图书馆论坛,2005,25(6):71-76
4 马丽娜. 知识图谱的构建及应用研究——以国内物联网研究为例[D].武汉大学,2012
5 张玉双. 我国高校图书馆知识管理研究的文献统计分析[J].晋图学刊,2008(5):45-48
6 王知津,王秀香,刘念、黄莹莹.国外索引研究进展:以 The Indexer为例[J].晋图学刊,2010(4):1-5
7 杨颖,崔雷.应用改进的共词聚类法探索医学信息学热点主题演变[J].现代图书情报技术,2011(1):83-87
8 向剑勤. 国内外图书情报学发展现状的可视化比较研究[D].武汉大学,2012
9 马费成,望俊成,张于涛.国内生命周期理论研究知识图谱绘制[J].情报科学,2010,28(3):334-340
10 张琪玉.图书内容索引编制法——写作和编辑参考手册[M].北京:化学工业出版社,2006
11 苏凡.书末索引与图书内容检索[J].图书情报工作,1987(2):23-24,40
12 曾蕾.索引工作自动化:计算机辅助标引及索引编制.中国索引学会,1994
13 郭丽芳.索引软件CINDEX的功能特点和索引编制.中国索引,2008,6(4):48-57
14 栾春娟,侯海燕,王贤文.国际科技政策研究热点与前沿的可视化分析[J].科学学研究,2009,27(2):240-243
15 Menard,E. Ordinary image retrieval in a multilingual context A comparison of two indexing vocabularies [J].Aslib proceedings,2010,62(4-5):428-437
16 侯剑华.工商管理学科演进与前沿热点的可视化分析[D].大连理工大学,2009
17 栾春娟, 赵呈刚. 基于SCI的基因操作技术国际前沿分析[J].技术与创新管理,2009,30( 1 ): 11- 13
赵蓉英 武汉大学信息管理学院教授、博士生导师, 武汉大学科学评价研究中心副主任。
吴胜男 武汉大学信息管理学院博士。