中文学位论文数据库的比较研究
——基于检索的角度分析
刘征鹏
(华中科技大学图书馆 武汉 430074)
摘 要 本文从检索的角度,以我国大陆地区7个全面收录中文学位论文的数据库为例,通过其检索方式、检索项及其检索结果的排序等方面的比较分析,提出若干改进的建议,旨在提高学位论文的检索效率。
关键词 学位论文 数据库 检索
1 概述
根据《中华人民共和国学位条例》(2004)规定:学位分学士、硕士、博士三级[1]。据此,学位论文相应分为学士学位论文、硕士学位论文、博士学位论文三种。
目前,大陆地区全面收录中文学位论文的数据库计有7个(见表1),分别属于文化部、中国科学院、科技部、教育部、北京万方数据股份有限公司及同方股份有限公司(原清华同方股份有限公司)。
表1 学位论文数据库统计
名称 | 出品 | 隶属 | 范围 |
国图博士论文库 | 国家图书馆 | 文化部 | 博士论文 |
中文学位论文库 | 国家科技数字图书馆 | 中国科学院 | 硕士、博士论文 |
中文学位论文库 | 国家工程技术数字图书馆 | 科技部 |
高校学位论文库 | 中国高等教育数字图书馆 | 教育部 |
中国学位论文全文数据库 | 万方数据知识服务平台 | 北京万方数据股份有限公司 |
中国博士学位论文全文数据库 | 中国知网 | 同方股份有限公司 | 博士论文 |
中国优秀硕士学位论文全文数据库 | 硕士论文 |
资料来源:①http://www.nlc.gov.cn/service/lw.htm; ②http://www.nstl.gov.cn/; ③http://www.istic.ac.cn/;
④http://etd.calis.edu.cn/ipvalidator.do; ⑤http://c.wanfangdata.com.cn/Thesis.aspx; ⑥http://www.cnki.net/。
基于“已经通过的硕士学位和博士学位的论文,应当交存学位授予单位图书馆一份,已经通过的博士学位论文,还应当交存北京图书馆和有关的专业图书馆各一份。”[2]因此,学位论文的检索路径,尚有各学位授予单位图书馆的学位论文服务系统。
数据库中的学位论文检索,是从著者、导师、题名、学科、主题、摘要、关键词、学位级别、学位(授予)年及学位授予单位等检索项中查找所需的信息过程。由于上述数据库所采用的系统不尽相同,从检索的角度而言,各有特点,通过彼此间的比较分析,旨在提高学位论文的查全率与查准率。
2 分析
首先,从检索方式来看,各学位数据库除有“检索词检索”之外,万方、同方、国家工程技术数字图书馆、CALIS高校学位论文库等另设有按学科分类的“目录浏览”。不过,万方是按照教育部颁布的《授予博士、硕士学位和培养研究生的学科、专业目录》(1997)中的学科分类组织文献[3];同方是以原国家技术监督局颁布的《中华人民共和国学科分类与代码国家标准》(GB/T13745-92)划分的学科为准[4];国家工程技术数字图书馆则是以《中国图书馆分类法》的22个学科门类为准[5],且未细分;CALIS高校学位论文库虽设有“学科浏览”,但无法链接。
其次,从检索项来看(见表2):(一)在“学科”项中,其学科名称是以教育部颁布的《授予博士、硕士学位和培养研究生的学科、专业目录》(1997)为准,由于上述数据库除同方之外,各数据库中的一级学科均不包含其下属的二级学科,因而有可能造成漏检,若以“建筑学”为检索词,其检索结果仅为以该学科名称著录的学位论文,而不包括其下属的“建筑历史与理论”、“建筑设计及其理论”、“城市规划与设计”、“建筑技术科学”以及其自主设置的7个二级学科;由于学科名称随着时间的推移,多有变化(见表3),且自2002年以来,(博士)一级学科下大多设有自主设置的二级学科,尤其是随着教育部颁布的《学位授予和人才培养学科目录》(2011)的执行,以学科专业为检索项,其漏检率,将大于其他检索项。(二)在“主题”项中,由于数据库界面没有提供相应的“主题词表”,普通用户可能不会利用此项,故该项的设置有待商榷。(三)在“摘要”项中,如何选定检索词,则具有相当之不确定因素。(四)对于集硕士、博士论文于一体的数据库(即CALIS高校学位论文库),由于没有限定条件,对于有特定要求的检索,则带来极大不便。(五)在“学位(授予)年”项中,由于学位年与学位授予年之间存在一定时间差,二者间常常跨年度。因此,二者之间的差异也有可能带来一定的漏检率。(六)从学位授予单位来看,高校的升格、整合,使诸多高校的名称发生变化,若未考虑这一因素,而用户若不了解这一变化,漏检是不可避免的。
表2 学位论文数据库检索项统计
数据库名称 | 检索项 |
著者 | 导师 | 题名 | 学科 | 主题 | 摘要 | 关键词 | 学位级别 | 学位授予年 | 学位授予单位 |
国图博士论文库 | ● | ● | ● | ● | ● | | ● | | | ● |
国家科技数字图书馆 中文学位论文库 | ● | ● | ● | ● | | ● | ● | ● | ● | ● |
国家工程技术数字图书馆 中文学位论文库 | ● | ● | ● | ● | | ● | ● | ● | ● | ● |
CALIS 高校学位论文库 | ● | ● | ● | ● | | ● | ● | | | ● |
中国学位论文全文数据库 | ● | ● | ● | ● | | ● | ● | ● | ● | ● |
中国博士学位论文全文数据库 | ● | ● | ● | ● | ● | ● | ● | | ● | ● |
中国优秀硕士学位论文全文数据库 |
资料来源:同表1
表3 建筑学二级学科名称变更统计
检索字段 | 检索词 |
学科 | 曾经名称 | 建筑历史与现代建筑理论 | 建筑设计 | 城市规划与设计 风景园林规划与设计 | 建筑技术 |
现有名称 | 建筑历史与理论 | 建筑设计及其理论 | 城市规划与设计(含:风景园林规划与设计) | 建筑技术科学 |
资料来源:教育部.授予博士、硕士学位和培养研究生的学科专业目录[A].中国教育年鉴:1991[M],人民教育出版社,1992:196-209
教育部.授予博士、硕士学位和培养研究生的学科专业目录[A].中国教育年鉴:1998[M],人民教育出版社,1999:215-224
另外,从检索结果的排序来看,有以学位年排序、有以著者字顺排序、有以相关度排序、有以系统默认排序等方式,但上述各学位论文数据库,除万方之外,其他者未对此做进一步的设计。如果在使用逻辑组配检索的前提下,其检索结果的数量较多,若无排序功能,将对有特定需求的用户造成相当之不便。
3 结语
综上所述,上述各学位论文数据库在检索方面,各有特色。但笔者以为:(一)鉴于教育部颁布的《学位授予和人才培养学科目录》(2011)没有提及二级学科[6],且学科种类有所调整。所以,学位论文的组织仍应以教育部颁布的《授予博士、硕士学位和培养研究生的学科、专业目录》(1997)为准。(二)一级学科(学位论文)在细分二级学科的前提下应包含二级学科(学位论文),同时也应包括学科(学位授予单位)更名前的学位论文。(三)简化检索项目,基于一般用户不常用或不甚了解的检索项,应予以剔除,因为若其他检索项的设计完备,其功能完全可以取代之。(四)检索结果的排序,应当设有年代排序、著者字顺排序、相关度排序等功能。
参考文献
1 教育部.中华人民共和国学位条例[EB/OL]. http://www.moe.edu.cn/publicfiles/business/htmlfiles/moe/moe_619/200407/1315.html
2 教育部.中华人民共和国学位条例暂行实施办法[EB/OL]. http://www.moe.edu.cn/publicfiles/business/htmlfiles/moe/moe_620/200409 /3133.html
3 教育部.授予博士、硕士学位和培养研究生的学科专业目录[A].中国教育年鉴:1998[M]. 北京:人民教育出版社,1999:215-224
4 国家技术监督局.中华人民共和国学科分类与代码国家标准(GB/T13745-92)[S]. 北京:中国标准出版社,1992
5 中国图书馆图书分类法编辑委员会.中国图书馆图书分类法(1-5版)[M]
6 教育部.学位授予和人才培养学科目录(2011)[EB/OL]. http://www.moe.edu.cn/ewebeditor/uploadfile/20110401155223935.doc
刘征鹏 男,1960年12月生,大学学历,华中科技大学图书馆馆员。