Derwent Innovations Index数据库的主要特点及其检索方法
郑 伟
(华东师范大学图书馆 上海200062)
摘 要 DerwentInnovations Index收录全面的专利文献,可以综合检索世界各国的专利文献,包括世界各地化学、电子电气以及工程技术领域内综合全面的发明信息,本文介绍该系统的特点、检索途径与方法等。
关键词 德温特 检索方法 DerwentInnovations Index Retrieval methods
专利文献体现着专利制度的法律保护和公开功能,同时也是集科技、法律、经济信息为一体的标准化的信息。全世界80 %以上的专利不再以其他形式发表,所以有效地获取专利信息对于科学研究和生产实践都是非常重要的。DerwentInnovations Index(DII)整合了Derwent 最著名的World Patent Index(世界专利索引) 与Patent Citation Index(专利引文索引),是收录较全面的专利文献数据库,可以综合检索世界各国的专利文献;每周新增来自40多个专利机构的2万5千多个专利;该数据库按学科分为化学(Chemical Section)、电子电气(Electrical & Electronic Section)、工程技术(Engineering Section)三大部分,为研究人员提供世界范围内的化学、电子电气以及工程技术领域内综合全面的发明信息。与其他专利信息资源相比较,DII 具有以下几个方面特点:强大的检索功能、被引及施引专利、描述性的标题和摘要、与ISI Web of Science 的双向连接。
1 Derwent Innovations Index 数据库主要特点
DII 具有高附加值的专利文献标引与索引以及强大的检索途径和面向用户的检索辅助工具;收录来自世界40多个专利机构的1千多万个基本发明专利,3千多万个专利,数据可回溯至1963年。由于专利文献所具有的法律性质,以及专利申请人为了有效地保护其发明创造,在专利文献中往往会用一些繁复晦涩、意义含混的专用术语(或法律术语),与一般科技论文中的通用技术用词不同,因此用习惯的常用词检索时,很难找全相关的技术专利文献,了解某项技术的全貌。Derwent的技术专家会用通俗的语言按照技术人员平常用词、行文的习惯重新用英文书写每一篇文献的标题和摘要,形成描述性的标题和摘要,即使用习惯的常用词进行检索,也不会有问题。
2 检索途径和方法
DII检索途径包括快速检索(Quick Search)、一般检索(General Search)、高级检索(Advanced Search)、被引专利检索(Cited Patent Search)、化合物检索(Compound Search)。
2.1 快速检索
快速检索(QuickSearch)类似google的检索,只需要在检索框里面直接输入检索词执行检索即可,检索词默认在所有字段进行检索。
2.2 一般检索
一般检索(FormSearch)包括主题(Topic)、专利权属人(Assignee)、发明人(Inventor)、专利号(Patent Number)、国际专利分类号(International PatentClassification)、德温特分类代码(Derwent Class Code)、德温特手工代码(DerwentManual Code)、专利入藏登记号(Derwent Primary Accession Number)、环系索引号(Ringindex number)、德温特化合物号(Derwent compoundnumber)、德温特登记号(Derwent registrynumber)等检索字段。
主题(Topic)是在题目或者摘要中进行检索,也可以单独限制在题目中检索,需要在Title后面打上勾。
专利权属人(Assignee)指有权享受专利的个人或团体,可用受让人名称或Derwent机构代码检索,点击检索框后的放大镜图标可以进入辅助检索,独特的机构代码确保检索该机构所有的专利情况。专利权属机构代码是指许多全球性的跨国公司或机构设在不同地区、国家的分支机构有可能会使用截然不同的名称,DII中对这些机构的名称作了标准化处理,即专利权属机构代码。例如:Nokia公司有很多分公司,但是他们的专利权属机构代码是OYNO,Nokia在不同地区、国家的分支机构用不同的名称作出的专利申请,在DII中,都会对其名称进行标准化(OYNO),这样可以很容易地找到属于Nokia的专利申请。如要检索Nokia公司有关第三代通讯技术的专利,可以使用OYNO专利权属机构代码进行检索,只需要在Assignee下面的检索字段中输入OYNO就可以检索到所有的Nokia公司的专利,而不会漏掉一些非常重要的专利。
国际专利分类号检索(International Patent Classification):International Patent Classification (简称IPC) 是根据世界知识产权组织WIPO的IPC 分类法对专利进行分类,并由各国专利局分配给予每个专利的分类号。IPC 分类体系是由高到低依次排列的等级式结构,是把与发明创造有关的全部技术领域按不同的技术范围设置成部(英文大写字母A~H)、大类(两位数字) 、小类(英文大写字母) 、大组(1~3 位数字) 或小组(斜线加1~3 位数字),由大到小的降序排列。一个完整的IPC 分类号由代表部、大类、小类、大组或小组的符号构成,如:车费计零部件的IPC分类号为G07B13/ 02。
德温特分类代码检索(Derwent Class Code) (简称DC):Derwent 分类系统是应用于所有专利的一个独特的系统,所有的技术领域按学科分为20 类,A~M (化学类) 、P 和Q (工程技术类) 、S~X (电子与电气) 。每个学科又进一步细分,并用3 个字符表示。A~M、S~X 的分类是由Derwent 的专家提供的,P 和Q 的分类参照国际专利分类号。每个学科类再进一步细分成不同的小类。每个小类由学科类的代码及两位数字组成。如X22 是AutomotiveElectrics 的分类代码,C04 是所有化肥的代码。
德温特手工代码(Derwent Manual Code) (简称MC):又称指南代码,比德温特分类代码更为详细,相当于广义的叙词表,根据专利文献的文摘和全文对发明的应用和发明的重要特点进行独家标引。主要是能提高检索的全面性和准确性,非常适应于科研人员的习惯和应用,并且能直接提供手工代码的检索辅助工具。
如第三代移动通讯技术(3G),“3G的核心技术”在于宽带移动通讯,支持多媒体数据在基站与终端设备之间的高速传输。“3G”涉及到了很多层面的技术:数据的压缩、打包、加密、传输;也涉及到众多的开发机构:Nokia,Motorola,Ericsson,Sony,Simens,GE…….;要在3G领域展开研发工作,第一件要做的事情就是通过专利文献去了解技术的最新进展,每家(研究)机构都用哪些不同的技术解决同一个问题,自己的切入点应该在哪里,也就是进行情报分析。如何选择主题词,在3G的专利文献中使用的主题词有很多种,有的文献用的是CDMA、CDMA2000、W-CDMA、TDS-CDMA,有的用3G、The Third Generation、3rd generation mobile communication、IMT-2000、UMTS、UniversalMobile Telecommunication System,甚至有的专利通篇都没有出现以上的字样。面临词汇概念内涵与外延的差异所导致的混淆。比如CDMA既包括3代移动通讯技术,也包括2代与2.5代移动通讯技术。另外还有一词多义的现象,比如3G也代表一个物理量:3克。因此我们所面临的难题:一方面要在大量不相关的检索结果中筛选所需要的文献,另一方面还可能有大量的文献检索不到。如果用德温特手工代码就会使复杂的问题简单化,德温特手工代码相当于一个广义的同义词表,将具有相似含义的不同词汇归入一个单一的代码。
如3G的Derwent手工代码是W02-C03C1G,也就是说无论专利文献中出现了什么样的词,甚至并没有出现任何相关的词汇,只要涉及3G某一个方面的研究如数据压缩、打包、传输等,DII都会给这篇文献相同的记号:W02-C03C1G。这样只需要用这样一个代码,就可以很容易地查全这方面的文献,而不用去考虑各种复杂的主题词组合。
Derwent手工代码则可以看作是专利领域中的IPC。但是与IPC出发点不一样,IPC是从功能角度,Derwent手工代码是从应用角度。举一个简单例子,现在要检索一个课题,名称是:一种装置,在录像机上能根据用户眼睛凝视的方向自动对物体定位(自动聚焦)。用正常的方法,关键词:自动对焦,录像机。检索结果有很多垃圾,在这个例子中用关键词很难描述这个装置,即使在IPC中也没有什么合适的分类可以利用。这时可以考虑用Derwent手工代码,在初检索中所有与录像机测距和聚焦有关的记录相关的代码是W04-M01D2C,而S05-D01C5A则包含了非医疗用物体的电气或电子测量,可用于检索依靠手指按压控制或依靠飞行员眼睛运动以控制飞机的方面的课题。将上述两个代码进行逻辑组配,即得到了非常相关的结果。从这个例子可以看出,用Derwent手工代码可以得到一个很满意的结果。同时由于IPC是一个世界性的标准,因此每个国家的专利审查员在对IPC的理解有不同,因此,一篇专利在不同的国家可能会得到不同的IPC分类,这就给专利检索带来很大的难度。但是Derwent的手工代码和分类则不同,只是德温特公司自己做的,因此,在分类上有很大的统一性。
德温特手工代码用于表明该专利的技术创新方面。它揭示了专利技术的外部特征和应用领域。利用德温特手工代码进行检索,可以提高检索的速度及准确性。 获取德温特手工代码的方法有两种途径: 其一,利用TOPIC(主题)检索字段进行相关主题初次检索,从中找到一篇或几篇与自己相关的专利手工代码;利用德温特手工代码检索字段进行二次检索。第二,可以点击右面的放大镜去了解相应的手工代码对应的主题。
德温特入藏登记号检索(Derwent Primary Accession Number):德温特入藏登记号是Derwent 给每个专利族的第一个专利分配的独特的标识号码,然后应用到该专利族的其他记录中。格式为用四位数表示的年份,连字符,然后是一个6 位数字的序号。如:2006-612782,通过德温特入藏登记号检索可方便地找到同族专利。
2.3 高级检索
高级检索(Advanced Search):适合熟练使用者使用,利用检索界面右侧给出的字段标识符构成复杂的检索式。如:TS=(CDMA or GSM) not (AN=Nokia or AE=OYNO)。
2.4 被引专利检索
通常每篇文献都是在借鉴前人研究的基础上进行的,因此需要在其文献中提及前人所发表的文献,即参考文献,或是引证文献。被引专利检索(Cited Patent Search):许多专利发明人在提交专利申请说明书时,会列出自己发明过程中所参考过的论文及已有专利;同时有的专利授予机构的专利审核员也会列出自己审核某一项专利授予权过程中所参考过的文献及已有专利。DII中会有专门的链接,显示这些有关某一项专利的参考文献及参考专利情况(来自于发明者和专利审核员的)。同时,DII中还会有CitingPatent的链接,显示某一项专利发明以来,被哪些专利引用过,借助专利与专利间,以及专利与论文间的引用与被引用关系,可以揭示出一项专利的理论、技术起源。并且利用Citing Patent 的链接,可以迅速追踪到一项技术自诞生以来,最新的进展情况,技术是否从这篇专利所有人那里流失,即别人在上面作了很多开发、改进;是否后来人有授权可能性;技术走向,这时可以参考IPC,MC,DC等等。被引专利检索不仅仅提供资料信息,更重要的是提供研究的思路。将过去、现在以至将来的相关文献信息连接起来;“越查越新”和“越查越旧”将不同学科、不同领域的相关研究连接起来,寻找“科学发展的生长点”和“知识创新”,研究人员由此可以发现许多过去不知道然而却非常重要的信息,从而产生许多新的创见与发现。
在专利的引文中进行检索,可供检索的字段包括:被引专利号(Cited Patent Number)、被引专利权属人(Cited Assignee)、被引专利发明人(Cited Inventor)、被引专利德温特入藏号(Cited DerwentPrimary Accession Number)。
2.5 化合物检索
化合物检索(compoundsearch):在StructureDetails区域点击鼠标右键,选择Transferto ISIS/Draw,就可以利用下载的绘图软件绘制结构图,并且能指定所画出的化学结构与化合物的关系或相似性。还可以进行如下文本检索和化学结构检索组合检索:Compound Name (化合物名称)、Substance Descriptor (物质描述词)、Structure Description(结构描述词)、Standardized Molecular Formula (标准分子式)、Molecular Formula (分子式)、MolecularWeight (分子量)、Derwent Chemistry Resource Number (德温特化学资源号)。
3 结果处理
3.1 精练检索结果
精练检索结果(refineyour search)可对100000条以内记录从以下角度进行结果提炼:专利权属人、专利权属人代码、发明人、IPC、Derwent Class Codes、Derwent ManualCodes。如想知道手工代码为W04-M01D2C的专利都集中在什么公司?检索手工代码为W04-M01D2C,根据自己的需要点击“refine your search”下面的专利权属人字段,就可以非常清晰的了解自己需要的文献,可以看到CANNO公司的这个方面的专利最多。
3.2 排序
排序(sort by)可对100000条以内记录从以下角度进行结果排序:出版日期、被引次数、发明人、专利权属人、德温特分类号、专利权属人代码、入库时间等,方便读者从不同的角度对检索结果进行详细的浏览。如想知道手工代码为W04-M01D2C被引用最多的专利是哪些?检索手工代码为W04-M01D2C,然后选择“sort by”下面的“Times Cited”,点击旁边的“Sort”就可以按照被引次数进行排列,排列结果显示专利号为EP656555-A被引用次数最多,达到84次,然后可以进一步的分析。
3.3 分析检索结果
真正的检索是为工作、学习、研究提供有效服务,对检索出的文献进行深入分析,以获取有效信息,促进科研工作的开展,一直是人们关注的问题。现在DII中的分析检索结果(analyse result)就提供了这样的一个平台。在检索结果界面点击“Analyse”,可对100000条以内记录从以下角度进行结果分析:专利权属人、专利权属人代码、发明人、IPC、Derwent Class、Derwent Manual Codes等。通过分析功能可以更准确地了解检索到的记录的相关信息,如通过按照出版年分析,可以了解这些相关的记录在什么时间发表的以及科研的走向;通过来源分析,了解这些相关记录都发表在什么杂志上,以便今后自己写文章的时候做为投稿指南等等。点击“SAVE Analysis Data toFile”后可以把分析结果保存在相应的文件里,以后进行更为详细的分析。
3.4 检索历史
在检索历史“SearchHistory”界面,可利用检索结果的序号组配完成更复杂的检索操作,可保存检索历史并创建邮件定题服务。
3.5 输出结果
在检索结果页面,可以在专利号前的选择框中标记该记录,然后点击提交标记按钮“Submit Marks”,也可以点击页面上“Mark Page”或“Mark All”按钮标记该页面上或检索命中的所有记录;在详细记录页面,点击“Mark”按钮标记该记录。若要删除标记记录,在简单记录页面,可以在选择框中去除标记,或点击“Unmark Page”按钮,在详细记录页面,点击“Unmark”按钮。若要清除所有标记记录,开始一个新的检索,应点击“Home”按钮,再点击“NewSession”按钮。
在已标记记录显示页面,可以选择输出字段以及输出方式。系统默认的输出字段有专利号、专利标题、发明人、专利权人四个字段,其他字段如IPC分类号、Derwent分类代码、被引专利、摘要等,用户可根据需要自己选择。输出方式有五种:编排格式后打印(Format For Print)、按文本文件保存(Save To File )、输出到ISI提供的参考服务软件(Exportto Reference Software )、保存德温特入藏登记号(Pan for Derpict)、通过E-Mail发送,在所选格式下,点击“Format For Print”按钮,系统按选定格式显示输出记录,使用浏览器的打印命令即可打印输出,格式与显示格式相同。通过E-Mail发送检索结果,需在“E-MailRecord to”后的输入框中填入欲输出的E-Mail地址,选择输出格式,然后点击“E-Mail”按钮即可。
4 小结
本文对DII数据库的特点以及检索方法进行简单的介绍,DII是基于创新应用平台研发的新型数据库,其文献的含金量居世界同类产品之首,检索功能更是独特而全面。希望本文的探索能为专业研发人员提供有效的专利获取通道,以谋求更好的创新开发战略。
参考文献
1 http://access.isiproducts.com
2 http://www.thomsonscientific.com
3 http://www.thomsonscientific.com/support
4 http://www.isiknowledge.com
郑 伟 男,1978年生,硕士,华东师范大学图书馆工作。