基于领域本体知识检索系统探究

基于领域本体知识检索系统探究

ID:31778326

大小:56.64 KB

页数:7页

时间:2019-01-18

基于领域本体知识检索系统探究_第1页
基于领域本体知识检索系统探究_第2页
基于领域本体知识检索系统探究_第3页
基于领域本体知识检索系统探究_第4页
基于领域本体知识检索系统探究_第5页
资源描述:

《基于领域本体知识检索系统探究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于领域本体知识检索系统探究摘要:为了解决传统信息检索存在的效率低、精度不高以及无法为用户提供个性化服务等问题,提出了将领域本体引入到信息检索的思路,并构建了基于领域本体的知识检索模型。在探讨基于领域本体的知识检索实现关键技术基础上,以毕业生求职招聘知识检索系统为例进行了知识检索性能的实验论证。实验结果表明该检索系统能有效的提高信息检索的准确率和效率。关键词:领域本体;知识检索;本体构建中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)31-7423-04随着计算机技术的不断发展以及互联网技术的日新月异,使得万维网上的信息

2、每天都以爆炸式增长,如何快速高效地在海量的数据中获取有价值的信息已成为了当前信息检索研究所面临的重大挑战。传统的基于关键字的语法匹配和全文检索方式,在早些年以其简单、快捷和容易实现等优点受到用户的亲睐,但随着社会的发展,这种传统的检索方式出现的漏检、误检以及无法为用户提供个性化的检索需求等问题逐渐显现出来。通过对传统检索系统的研究,总结出传统检索方式存在以下几个较突出的问题:第一,忠实表达问题。大多数检索系统主要是借助于目录、索引和关键字等方法来实现,结构单调统一,很多情况下,用户很难通过简单的几个关键词就能够真正表达出他所需要检索的内容,因此表达

3、上的困难导致检索质量的降低。第二,一词多义问题。不同的检索用户有着不同的检索目的,当以同一组关键词进行检索时会得到同样的检索结果,无法实现用户的特殊检索需求。第三,同义词问题。基于关键字匹配的检索技术,是严格按照用户提交的查询请求在全文中进行关键字匹配的检索方式,没有理解和处理信息的能力,因此许多与关键词的同义词信息就无法检索出来。第四,词汇孤岛问题。在人的大脑中,概念之间存在着各种各样的联系,而在基于关键字的检索系统中,这种概念之间的语义联系很难进行描述。上述问题存在的根本原因就在传统的检索机制没有考虑到用户的检索意图,缺乏对知识的理解、表示和处

4、理的能力,也就是缺少必要的语义性和智能性,以致于知识检索的效率和准确性较低。为了提高信息检索的效率和质量,在设计检索系统时,就需要把检索机制从传统的基于关键字层面提升到基于语义的层面上来,充分考虑用户的检索意图,以避免仅以表达式匹配的方式进行检索而形成的不足。针对以上问题,本文提出了基于领域本体的个性化信息检索方法,充分利用本体具有的良好的概念层次结构以及对逻辑推理的支持,为用户进行检索时提供检索关键词的语义分析,发掘用户在输入的简单的查询请求后所隐含的语义信息,从而更好地理解用户的真正检索意图,以便实现用户个性化的信息检索需求。本文在充分的了解了

5、领域本体在实现信息检索系统智能化的优越性后,以毕业生就业求职信息检索作为系统开发背景,以提高查全率和查准率为主要目标,采用领域本体作为求职招聘信息知识的组织方式,构建了基于领域Ontology的知识检索模型框架,结合模型框架开发了毕业生求职招聘知识检索系统,实验结果表明该系统能有效地提高信息检索的质量和效率。1基于领域本体的知识检索模型知识检索是指根据用户的知识需求表达形式,在知识库中匹配出满足用户需求的知识项及相关知识内容。基于领域本体的知识检索是指以基于Ontology的知识表示语言表示、检索领域知识,并支持直接用自然语言进行检索的知识检索,具

6、有良好的概念层次和表达能力,能根据一定的规则进行推理和检索。经过对本体论的分析研究,构建了基于领域本体的知识检索模型(图1)。通过模型可以看出基于领域本体的知识检索与传统的检索区别就在于语义知识检索引入了本体知识库。当用户进行查询时系统会调用本体映射函数将用户的查询请求转化为本体规则约束中已定义好的规范化的同义或相近概念,然后将规范化的概念提交给检索引擎,检索引擎通过与知识库中的知识项进行语义匹配、单词扩展以及词间扩展等处理后,最后将查询结果返回,这样就很好地避免了在词汇理解上的歧义性。正是基于领域本体的知识检索系统能够利用推理机对用户的查询信息进

7、行推理(即系统具有理解和处理自然语言的能力),所以系统在用户进行查询时就能够充分保证实际的检索效率,并能满足不同用户的个性化检索需求。2基于领域本体的知识检索系统设计与实现的关键技术2.1领域本体的构建方法在知识检索模型中,领域本体是核心组成部分,它定义了领域内共同认可的概念及概念间的关系,提供了对领域知识的共同理解,对于提升信息检索的准确性起着至关重要的作用。Protege是用Java编写的一个开放源码的高效的Ontology编译器,具有图形化界面且提供了很多插件和接口,可以将构建的本体存储为各种形式的文件并支持本体的数据库持久化。本研究利用Pr

8、otege工具构建领域本体,构建步骤如下:第一,确定本体的领域和范围。在现实社会中多数领域和学科都存在着很大的交叉性,要想

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。