基于本体的分布式信息检索

基于本体的分布式信息检索

ID:39474564

大小:86.00 KB

页数:8页

时间:2019-07-04

基于本体的分布式信息检索_第1页
基于本体的分布式信息检索_第2页
基于本体的分布式信息检索_第3页
基于本体的分布式信息检索_第4页
基于本体的分布式信息检索_第5页
资源描述:

《基于本体的分布式信息检索》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、本体在分布式信息检索中的应用马小霞郑会云(山东曲阜师范大学信息技术与传播学院,山东日照276800)摘要:随着数字化信息的爆炸式增长,Internet成了一巨大数据库。现有的搜索引擎检索出的内容已难以保证与用户所需内容的精确匹配。本文所研究的结合本体的分布式信息检索能有效地改善这一问题,提高检索的效率和准确率。关键词:本体;信息检索;分布式检索算法Abstract:withdigitalinformationexploding,Internethasbecomeahugedatabase.Thecontentcrawloutfro

2、mexistingsearchenginesisdifficulttomatchwithusersrequiredaccurately.DistributedinformationretrievalwithontologycanimprovetheproblemeffectivelyandimprovetheretrievalefficiencyandaccuracyKeyword:Ontology;informationretrieval;distributedretrievalalgorithm引言近年来,随着人们对检索效率和

3、准确率要求的不断提高,使得本体在信息检索中的应用得到迅速发展。基于移动Agent的分布式的多层结构已经广泛地应用在数据库系统的研究与开发中,能有效提高检索系统的效率、灵活性和可扩展性。在信息检索中,结合本体与分布式技术进行信息检索已经成为人们研究的热点。一、本体概述随着人们对知识表示、信息组织和复用以及为用户提供有效服务的需求越来越强,本体(Ontology)作为一种能在语义和知识层次上描述信息系统的概念模型建模工具,自提出以来就引起了国内外众多科研人员的关注,并在许多领域得到了广泛应用,如语义Web、智能信息检索、信息集成、数字

4、图书馆等领域。(一)本体的定义本体(Ontology)是一个从哲学领域引入的词汇。Ontology的含义是从抽象的、形而上学层面逐渐转化为工具性的、具有特定意义的理解。因此,Ontology在不同的语境中有不同的解释。1998年Studer[1]提出“本体是共享概念模型的明确的形式化规范说明”这一概念得到了学术界的广泛认同。此概念体现了本体的以下几层含义:8概念模型(Conceptualmodel):通过抽象出客观世界中一些现象的相关概念而得到的模型,其表示的含义独立于具体的环境状态。明确(explicit):所使用的概念及使用这

5、些概念的约束都有明确的定义。形式化(formal):本体是计算机可读的。共享(share):本体中体现的是共同认可的知识,反映的是相关领域中公认的概念集,它所针对的是团体而不是个体。[2](二)本体的分类根据不同的属性,可将本体分为不同的类别。1、按照对领域的依赖程度分类:顶层(top-level)本体、领域(domain)本体、任务(task)本体、应用(application)本体[3]top-levelontologytaskontologydomainontologyapplicationontology图1-1四类本体之

6、间的关系2、按照细化程度分类:参考(reference)本体:详细程度高;共享(shareable)本体:详细程度低。3、按照形式化程度分类(1)结构非形式化:用限制的结构化的自然语言表示;(2)高度非形式化:用自然语言松散表示;8(3)半形式化:用半形式化(人工智能)语言表示;(4)严格形式化:所有术语都具有形式化的语义,能在某种程度上证明完全性和合理性。(三)本体描述语言由于大量的研究工作者对该领域的关注和研究,使得本体领域诞生了许多种描述语言,例如:RDF和RDF-S、OIL、DAML、OWL、KIF、SHOE、XOL、OC

7、ML、Loom等。期中,与Web相关的有:RDF和RDF-S、OIL、DAML、OWL、SHOE、XOL。RDF和RDF-S、OIL、DAML、OWL、XOL之间有着密切的联系,是W3C的本体语言栈中的不同层次,也都是基于XML的。SHOE是基于HTML的,也是在HTML基础上的一个扩展。另外,与具体系统相关的(基本只在相关项目中使用的)有:Ontolingua、CycL、Loom。二、分布式信息检索分析分布式信息检索主要是指在分布式的环境中,利用分布式计算和移动代理等技术从更大量的、异构的信息资源中检索出对用户有用的信息的过程。

8、[4]分布式环境指的是信息资源在物理上分布于各地,小到一个办公室,大到跨越国家。这些分布式的信息资源在逻辑上是一个整体,从而构成一个分布式检索系统。(一)分布式信息检索原理一个简单的分布式信息检索系统由信息库服务器和多个代理服务器两部分构成。在一个

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。