欢迎来到天天文库
浏览记录
ID:4141071
大小:186.38 KB
页数:2页
时间:2017-11-29
《从pubmed看主题词与关键词的结合运用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、万方数据第20卷第12期航空航天医药2009年12,El135从PubMed看主题词与关键词的结合运用张朝霞(苏州大学附属儿童医院图书馆,江苏苏州215003)摘要对比研究了主题词和关键词优越性和局限性,分析了当前信息资源的特点,通过PubMed检索实例说明关键词与主题词结合的检索系统在检索效率上的优越性,并分析了它的检索机制。关键词PubMedUMLS;自动词语匹配;主题词;关键词中图分类号:R197.38文献标识码:B文章编号:1005—9334(2009)12-0135—02情报检索语言是沟通信息标引者与信息需求者思想的桥梁,检索系统的功能是由情报检索语言支持的,有科学的情报检索
2、语言,才能够实现更合理的检索系统。情报检索语言分为自然语言和人工语言两大类,它们各有其特点和优势,对它们在网络环境下的融合的研究,以便更好地解决检索速度和效率的问题,成为情报检索语言研究的一个重要内容。1主题词和关键词的优越性和局限性1.1主题词和关键字的优越性主题词作为一种受控的人工语言,主要有以下优势:容易排列概念、简明专指、词语和概念一一对应避免同义多义词、能显示概念间关系等,这些优点集中表现为它的标识具有符合唯一性、规律性、定型性、通用性、准确性等质量要求,因此具有较高的检准率和检全率¨J。关键词法作为一种自然语言,其自身优势更适合现代网络环境下广大网络终端用户对情报信息易用性
3、、便捷性的需求,深受用户的欢迎,它的优点在于:语法简单易用、不受词表限制、可对文献专指标引且标引速度快、具有较高时效性、概念失真率低等等嵋-。1.2主题词和关键字的局限性主题词标引要求高负担重、词汇管理难度大、更新滞后、限制用户自由表达、专指度低且易失真、受标引者影响大、用户难掌握等等【3J。另外主题词表的精髓概念组配在信息处理电子化的今天,其必要性降低,而概念组配带来的标引自动化处理的复杂性却日益成为提高信息加工和检索效率的障碍。关键词缺乏严格的组织,检索质量和效率都难尽人意,特别是检全率难以保证。由于同一主题的文献因标引者的用词不同而被分散,检索者必须用表达该主题的许多个等同关键词
4、同时查找,才能不漏查文献。另外,关键词法不显示词之间的等级关系和相关关系,使检全文献的难度相应增加。另一方面,关键词是来自文献自身题目、摘要、关键词以及正文,进行的是词形匹配,检出的文献只是字面相符,出现大量冗余文献,影响了检准率。2优势互补——主题词与关键词结合2.1自然语言与人工语言相结合的依据综上所述,主题词和关键词各有其优缺点,主题词的特异性比关键词高,而关键词的灵敏性比主题词高。所以人们希望通过各种方式来弥补它们的不足。如:(1)对关键词的改进:一类是用其他的检索体系辅助检索,如分类体系、主题树等;另一类是对关键词提取做出限定,如布尔查询、限制查询等,这实际上也降低了关键词检
5、索入口的自由度,削弱了关键词法的优势;(2)对主题词法的改进:一类是关于概念词索,如进行增改、更新、剔旧等;另一类是关于概念组配方式,如前控、后控、前组、后组等,但这些仍没有改变使用困难的现状一j。现代信息资源的剧增使广大信息用户要求通过更便捷的检索方式获得准确信息,关键词法与叙词法都不能有效满足这种需求,就势必寻求借助外来因素的整合。因此,人工语言标识与自然语言标识并用已成为趋势。在现代计算机检索中,自然语言标识已占有重要地位。以1967年建立的英国INSPEC系统为例,1968—1976采用的全是规范词,而从1971年开始增加了自由词,到了1973年正式采用了规范词、自由词和分类号
6、组织的整体性情报检索语言。该系统规定,每篇文献平均标引4个规范词、7个自由词和2个分类号。2.2自然语言与人工语言融合的方法在同一情报检索系统中自然语言与人工语言并用,用人工语言对情报信息主题进行规范控制和自然语言对情报信息主题进行非规范控制,从而弥补对方的不足,继而满足情报用户多种情报需求。可以通过编制自然语言词表来增加自然语言成分。所谓自然语言词表,实际上是自然语言接口用的对应表。自然语言接口用的对应表是在情报检索语言系统之前安置一个自然语言语词表与人工语言语词的对应表,其前端为自然语言的语词,后端为人工语言的语词。这种对应表一方面可以改善受控人工语言的性能,同时又可以提高查全率。
7、并减轻标引人员和检索者的负担。目前,图书情报界普遍都比较认同通过编制后控制词表来辅助检索。所谓后控制词表实质上是一种自然语言与人工语言之间的相互转换工具,只不过人工语言在检索之前实施控制(前控),后控制词表是标引时不控制,检索时才予以控制。关于自然语言后控制词表的编制,最重要的是将人工语言中的规范和控制原理运用到自然语言中。3PubMed一主题词与关键词相结合的典范3.1PubMed简介PubMed是由美国国立医学图书馆下属的生物技术信息中心(
此文档下载收益归作者所有