基于ontology的信息检索系统的研究

基于ontology的信息检索系统的研究

ID:34592372

大小:1.34 MB

页数:41页

时间:2019-03-08

基于ontology的信息检索系统的研究_第1页
基于ontology的信息检索系统的研究_第2页
基于ontology的信息检索系统的研究_第3页
基于ontology的信息检索系统的研究_第4页
基于ontology的信息检索系统的研究_第5页
资源描述:

《基于ontology的信息检索系统的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、~坦j!三些盔堂堡主兰丝迨苎的参数‘2。查全率是检索出的相关文档数与文档集中所有的相关文档数的比率。对于Web信息检索系统来讲,因为对于一个查洵总能返回很多信息,查全率一般不成问题。没有一个Web信息检索系统能够搜集到所有的Web网页。】,查全率很难比较,因此衡量Web信息检索的性能时,查全率很少使用。查准率是检索出的相关文档数与检索出的文档总数的比率。一般来说,查准率很少能够达到100%。对于一个信息检索系统来讲,查全率和查准率不可能两全其美。查全率高时,查准率低。为了达到很高的查全率,需要使用限制较弱的检索条件,这样查准率不高,反之亦

2、然。较好的做法是对查全率与查准率两种骂求采取中庸态度,即采用中间程度的检索条件,这样可以得到一种中间最优效果。3.信息检索技术的分类(1)全文检索(TextRetrieval)全文检索就是把用户的查询请求和全文中的每一个词进行比较,不考虑查询请求和文件语义上的匹配。缺点是虽然可以保证查全率,但是查准率大大降低。(2)数据检索(DataRetrieval)数据检索是查询要求和信息系统中的数据都遵循一定的格式,具有一定的结构,允许对特定字段检索。需要有标识字段的方法。其缺点是性能取决于所使用的字段标识方法和用户对方法的理解,具有很大的局限性,

3、支持语义匹配的能力较著。(3)知识检索(KnowledgeRetrieval)知识检索是基于知识的、语义上的匹配,在查准率和查全率上有更好的保证。是信息检索的重点,特别是面向web信息的知识检索的重点。卜1—2Ontology的定义Ontology是一个哲学上的概念,用于描述事物的本质,在近一、二十年,Ontology已被计算机领域所采用,用于知识表达、知识共享及重用,许多学科和研究领域都在使用“本体”这个术语,但存在不同的定义。1.哲学中Ontology的含义Ontology是西方哲学特有的一种形态,人们把它当作从帕拉图到黑格尔的西方传

4、统哲学的主干或“第一哲学”,这就意味着它是各个哲学分支的理论基础,是理论中的理论,哲学中的哲学。从Ontology的发展形态看,它是把系词“是”以及分有“是”的种种“所是”(即存在)作为范畴,通过逻辑的方法构造出来的先验原理体系。“是”是西方哲学中最抽象,最普遍的范畴,存在和本质是“是”是有区别的,Ontology中的“是”的意义就是它的逻辑规定性,这是Omology语言与日常语言的一个根本区别。日常语言中的词或概念归根结蒂是经验的:它或是指示一个经验中的对象或者是主观心态的描述,而Ontology的语言则是通过其范畴的逻辑规定性而使“语

5、言”变成了某种独立的特殊王国,这就是Ontology哲学的语言秘密,Ontology“通过词的形式具有自身的内容”,Ontology语言的这一特性,同Ontology的特殊思想方式是一致的,它是一种纯粹的思想哲学。第一位为Ontology下定义的是德国哲学家沃尔夫,他认为:“Ontology论述各种抽象的,完全普遍的哲学范畴,在这个抽象的形而上学中产生偶性、实体、因果现象等范畴。”所以,Ontology是靠从概3的参数[21o查尘率是检索出的相关文挡数与文档集中所有的相关文档数的比率。对于Web信息检索系统来讲,因为对于一个查陶总能返回很

6、多信息,查全率一般不成问题。没有一个Web信息检索系统能够搜集到所有的Web阿页”1,查全率根难比较,因此衡量web信息检索的性能时,备,垒=率很少使用。音准率是检索山的相关文档数与检索出的文档总数的比率。~般来说,查准率很少能够达到log%。对于一个信息检索系统来讲,查全率和查准率不可能两全其美。查全率高时,查准率低。为了达到很高的查垒率,需要使用限制较弱的检索条fl:,这样查准率不高,反之亦然。较好的做法是对查全率与齑准率两种要求采取中庸态度,即采用中间程度的检索条件,这样可以得到一种中间最优效粜。3.信息检索技术的分类(1)全文检索

7、(TextRetrleval)全文检索就是把用户的查询请求和仝文中的每~个词进行比较,不考虑查询请求和文件语义上的匹配。缺点是虽然可以保证杏全率,但是查准率大大降低。(2)数据检索(DataRetrieval)数据榆索是查询要求和信息系统中的数据都遵循一定的格式,具有一定的结构,允许对特定字段检索。需要有标识字段的方法。其缺点是性能取决于所使用的字段标识方法和用户对方法的理解,具自很大的局限性.支持语义匹配的能力较差。(3)知识检索(KnowledgeRetrieval)知识检索是基于知识的、语义上的匹配,在查准率和查全率上有更好的保证。

8、是信息检索的重点,特别是面向web信息的知识检索的重点。卜1—2Ont0109y的定义Ontology是一个哲学上的概念,用下描述事物的本质,在近一、二十年,Onlo

9、oBy己被计算机领域所采

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。