基于课程本体的语义检索研究及应用

基于课程本体的语义检索研究及应用

ID:34851205

大小:1.29 MB

页数:60页

时间:2019-03-12

基于课程本体的语义检索研究及应用_第1页
基于课程本体的语义检索研究及应用_第2页
基于课程本体的语义检索研究及应用_第3页
基于课程本体的语义检索研究及应用_第4页
基于课程本体的语义检索研究及应用_第5页
资源描述:

《基于课程本体的语义检索研究及应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、重庆大学硕士学位论文语义检索又称概念检索、知识检索,是一种基于知识的、语义上的分析检索,是在自然语言理解、计算语言学发展的基础上产生,以知识库为基础的在查全率[5]和查准率都能较好满足用户检索的检索方式,是当前信息检索发展趋势。现阶段用于支持语义检索的知识库一般以词典的形式为主,如国外的Wordnet、[6]国内的Hownet等。Wordnet是基于心理语言规则的英文词典,它以synsets为单位组织信息,synsets是在特定的上下文环境中可互换的同义词集合,Wordnet可以获得两方面的信息:词形和词义;Hownet也称为知网,是一个以汉

2、语和英语的词语所代表的概念为描述对象,以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库。这种词典形式的组织方式内容比较全面,有很好的指导参考作用,但是词典形式也使词条之间关系的复杂性在使用过程中存在效率问题。因此词典形式的知识库在知识组织上需要进一步的改变。同时基于良好概念层次结构并对逻辑推理提供支持的本体发展为语义检索研究的热点。本体是一种能够在语义和知识层次上描述信息的概念模型建模工具,自提出来就引起了国内外众多科研机构及人员的关注,并在计算机许多领域得到了广泛应用,从而使得信息检索从基于关键词的层面提高到基于知识

3、层面成为可能。在传统信息检索技术中引入本体,不仅可以对用户的检索请求进行自然语言的处理和理解,还可以对文档中的信息内容进行语义层次上的处理,从而在检索过程中得到符合用户需求的检索结果。1.2国内外研究现状近年来,美国、欧盟等大学实验室和研究机构相继提出了很多具有代表性的基[7]于本体的信息检索系统,如基于顶层本体设计的WebKB;基于XML表示的Quest、Elixir、XIRQL等。由于研究学者在这些系统研究开发过程中所侧重的理念不尽相同,故本体在系统中扮演着不同的角色。文献[7]依据文档处理方式的不同,将基于本体的信息检索系统分类基于知识

4、库的语义检索和基于语义网文档的信息检索。基于知识库的语义检索系统主要利用自然语言处理技术根据领域本体描述将网页或自然语言文本转换为大量信息实体。这种信息实体以某种知识表示语言描述存储在知识库中,搜索引擎可以对知识库进行推理和检索。早期的SHOE项目、欧洲科研信息系统AURIS-MM以及OntoText语义研究实验室开发的KIM平台都是基于知识库的语义检索系统。基于语义网文档的信息检索系统的处理对象主要包含语义标注语言的网页,由语义网语言书写的语义网文档能够被软件代理直接访问。它将语义网文档中的语义信息转换为搜索引擎能够处理的统一格式存储在一个

5、RDF文件或者OWL文件21绪论中,这类系统包括Ontobroker、马里兰大学设计和研发的基于语义网搜索引擎原型系统Swoogle以及UMBC大学eBiquity实验室开发的语义网信息检索、推理引擎OWLIR等。[8]目前国内研究基于本体的知识检索文献主要分为4类:一是分析本体检索的特点,从理论上论证本体适用于检索的优点;二是提出基于本体检索的原型或设计框架,但还没有系统的实现;三是从系统实现的角度探讨本体检索系统,但对本体的理解各有千秋。四是重点研究基于本体信息检索机制,主要分为三类:一类是研究基于本体的语义相似度计算;第二类是对知识的描

6、述逻辑研究实现对本体查询机制的探索;第三类是基于本体技术,同时结合语义分析技术探索本体检索模型。基于本体的知识检索研究之所以具有如此多的研究热点,主要原因在于研究者希望通过引入本体解决目前检索中存在的检索效率无法很好满足检索需求的现状。基于本体的检索在知识层面上进行检索匹配,刻画了知识概念间的内在关系,因此挖掘出隐含的、不明确的信息和概念,除了在检索效率方面能够更好满足用[9]户要求,还具有其他明显优势:①语义理解由于用户的职业、地域或学历层次的差异,对同一个事物的描述可以用不同的语言文字进行表达。因此对同一概念的表达,不同的用户可能使用不同

7、关键字。本体中可以对同一个概念映射到不同的词条,理解用户检索需求,从而解决表达差异的问题。②检索范围准确由于本体以语义分析为基础,相对于采用关键字全文检索而言,本体采用基于概念的检索。通过知识概念检索技术,明确和缩小了检索范围,从而减少对无用信息的检索,提高检索效率。③检索结果综合本体实现在人和Agent间对共享信息结构的认识,由于本体包含概念之间的关系,因此检索的结果还可以将检索需求相关的一些信息返回给用户。如查询“计算机网络总线拓扑”,返回信息可能不仅包含该拓扑结构的知识,还可能包含“星型拓扑”,“环形拓扑”等其它网络拓扑信息。④具有文本

8、挖掘功能比如对数字的理解,新词学习等。如“跳转寻址”,可以根据文档中对它的描述,如指令格式、操作码和地址码等内容,这些在本体中都有相应的概念名,并且这些概念同时修饰

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。