基于umls医学资源库语义扩展检索系统架构

基于umls医学资源库语义扩展检索系统架构

ID:6073700

大小:34.00 KB

页数:10页

时间:2018-01-02

基于umls医学资源库语义扩展检索系统架构_第1页
基于umls医学资源库语义扩展检索系统架构_第2页
基于umls医学资源库语义扩展检索系统架构_第3页
基于umls医学资源库语义扩展检索系统架构_第4页
基于umls医学资源库语义扩展检索系统架构_第5页
资源描述:

《基于umls医学资源库语义扩展检索系统架构》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于UMLS医学资源库语义扩展检索系统架构  摘要:基于UMLS的医学资源库的搜索模块通过将搜索关键词的映射到UMLS超级叙词表中相关概念的词串,经过“OR”运算,进行语义扩展的搜索。可以提高查准率和查全率。可以使用MetaMap映射工具,也可以直接访问超级叙词表;可以采用本地数据访问和使用WEB服务两种方式的系统架构来访问UMLS。关键词:UMLS;资源库;语义扩展;搜索中图分类号:TP311文献标识码:A文章编号:1009-3044(2014)01-0163-031医学资源库的知识组织及检索的不足在医学资

2、源库中,资源以视频、音频、动画、文档、PPT、积件等多媒体形式存在。资源入库必须以人工标注的方式进行元数据标注。传统的医学资源库的资源检索采用的是关键词匹配。有的检索系统会在关键词匹配的基础上增加类别限制、时间限制、作者限制等范围限制来提高搜索的精确性。但是语言常常具有多义性、同义性、模糊性,比如Aspirin(阿司匹林)和Acetylsalicylicacid(乙酰水杨酸)、Cancer(癌症)和Malignantof10neoplasm(恶性肿瘤)、Scar(伤疤)和Cicatrix(疤痕)分别都是同义词

3、,但是各自都是完全不同的关键词。所以按照关键词搜索不可避免的会影响搜索的查全率和查准率。在生物医学领域中,名词和术语比较多,一词多义现象和多词一义现象很多。除此之外,还有大量的术语之间的语义联系,比如词的上下位关系,关联关系,难以通过关键词搜索表现出来。所以,在搜索模块中,有必要引入一个生物医学领域统一的可控术语表,进行语义扩展的搜索。2UMLS(一体化医学语言系统)及其语义网络介绍一体化医学语言系统(UnifiedMedicalLanguageSystem,UMLS),由美国国立医学图书馆(NLM)研制并维

4、护。UMLS是生物医学概念所构成的一部广泛全面的叙词表和本体,是对生物医学科学领域内许多受控词表的一部纲目式汇编。UMLS提供的是一种位于这些词表之间的映射结构,使这些不同的术语系统之间能够彼此转换。UMLS主要由超级叙词表、语义网络、专家词典三个组件构成。超级叙词表是UMLS的基础。是由来自各种受控词表的概念和术语以及它们之间的关系所构成的集合;超级叙词表中收录100多万个生物医学概念和500多万个概念名称。概念源自UMLS收录的100多部受控词表和分类系统。超级叙词表之中的每个概念都指定有至少一种“语义类

5、型(Semantic10type)”。某些“语义关系”可以存在于多种语义类型的成员之间。语义网络正是这些语义类型和语义关系所构成的一种网络式目录。这是一种相当宽泛的分类;目前,其中共计有135种语义类型和54种语义关系。3基于UMLS的医学资源库语义搜索系统架构利用UMLS做语义扩展恰好能弥补资源搜索中关键词匹配种种局限。因此,该文设想在医学资源库的搜索模块中将UMLS的超级叙词表作为搜索模块的后控词表。UMLS本身提供了SKR(语义知识表达)工具,可以以交互模式和批处理模式两种进行自然语言处理。其中,MTI

6、(MedicalTextIndexer)可以进行文章的自动标引;MetaMap用来将自由词映射到UMLS超级叙词表中的词汇;SemRep用来提取生物词汇和短语中的语义类型。UMLS提供了WEBAPI来访问这三个工具,也可以下载这些工具的安装程序本地安装使用。在这些工具中,MetaMap是SKR工具的核心,可以作为用户和超级叙词表之间的桥梁。除了上述工具以外,UMLS的超级叙词表和语义网络中的数据可以通过两种方式直接访问,一种是安装MetamophorSys程序,同时将词表文件及语义关系文件下载到本地,导入到M

7、ySQL数据库或者Oracle数据库,使用UMLS提供的JAVAAPI进行本地访问;另一种是通过SOA服务访问,UMLS提供了WEB服务访问的接口,可以使用JAVAAPI基于WEB服务接口访问,实现基于服务的系统架构。10综合以上分析,基于UMLS的医学资源库的搜索模块可以有四种形式的架构:(1)下载安装MetaMap映射工具,使用JAVAAPI访问本地MetaMap程序来使用超级叙词表;(2)使用WEBAPI访问MetaMapWEB服务来使用超级叙词表;(3)安装MetamophorSys程序,使用JAVA

8、API直接访问超级叙词表;(4)使用美国国立图书馆提供的WEBAPI直接访问UMLS的WEB服务。。该文以使用MetaMap映射工具为例给出基于UMLS的搜索的流程,如图1所示。4基于UMLS的搜索效果分析下面对基于UMLS的搜索结果进行理论分析,以术语“lungcancer(肺癌)”的搜索为例。1)使用MetaMap工具映射到超级叙词表,其搜索流程如图2所示。MetaMap的自动文本映射主要步骤有

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。