基于ontology的智能信息检索关键技术研究

基于ontology的智能信息检索关键技术研究

ID:34838691

大小:1.78 MB

页数:61页

时间:2019-03-12

基于ontology的智能信息检索关键技术研究_第1页
基于ontology的智能信息检索关键技术研究_第2页
基于ontology的智能信息检索关键技术研究_第3页
基于ontology的智能信息检索关键技术研究_第4页
基于ontology的智能信息检索关键技术研究_第5页
资源描述:

《基于ontology的智能信息检索关键技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、螭于Ontology的智能竹息检索关键技术研究4l%的^、通过搜索引擎进入购物网站,84.6%的新网站是通过搜索引擎被发现。同时,科学证明,搜索引擎也是未知状态下发现有效信息的最有效方封”。这些数据足以表明,先进的信息检索技术对于网民和商业用户来说,都极具使用价值的。信息检索作为信息学领域中最活跃的研究分支之一,其涉及到多学科领域的交叉合作,主要包括:信息的组织、存储、索引、异质数据源的集成和人工作智能等技术,信息检索技术的研究与发展和这些相关领域的发展是息息相关的,同样的,对新型智能信息检索技术的研究也能推动相关科研领域的发展

2、。因此,智能信息检索技术研究还具有较高的学术理论意义。1.2国内外研究现状及分析信息检索(InformationRetrieval),通常指文本信息检索,包括信息的存储、组织、表现、查询、存取等各个方面,其核心为文本信息的索引和检索,起源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶首先开始发展,至20世纪40年代,索引和检索成为图书馆独立的工具和用户服务项目。互联网技术对信息的传播方式带来了巨大变化,也明显地促进了信息检索技术的发展和应用,一大批搜索引擎产品也随之诞生,为网民提供了快速信息获取和网络信息导航工具。从某种程度

3、E可以说,网络信息检索代表了当代信息检索的发展方向,所以,本文也将网络信息检索作为主要的研究对象。目前还有下列困难:浏览器采用关键字匹配;不能理解用户的需要,不能理解概念,例如,查询SAPS(非典)的有关研究论文,不会返回SARS出现以前有关冠状病毒的论文;搜索引擎检索到的信息常常不是最新的。上述问题的关键在于Web数据管理中的一些矛盾如下:●数据管理有序性与Web上信息无序型:,●搜索引擎查全率查准率与数据缺语义;●信息获取效率与Web海量动态数据。具体表现在以下几个方面:2中国海洋人学学位论文(1)搜索的结果太广泛:在互联网

4、上寻找信息就如同大海捞针,搜索引擎没有帮助你找到大海中的那根针,而是给了你整个海洋。要解决这种问题,通常要尝试多种关键词的组合输入。耗费时间较多。(2)搜索的网页无法显示:搜索的网站已转移,但是新的连接地址未知。(3)有价值的网页无法在此获取:当上次搜索到了很多价值的内容,想再次浏览时,却发现无法再找到了,利用同样的搜索方法进行搜索都只是返回一堆无用的结果,真J下要找的网页已经不见了。因为搜索引擎会永不停的从它们的索引库中抛弃已索引的网页。有时时成千上万的网页。这些被遗弃的网页有的会重新出现在更新的索引库中,有的则不会。(4)不

5、能理解和辨别多义词:比如让搜索引擎搜索‘'java”,但是你要找的信息究竟时太平洋上的一个小岛、一种著名的咖啡、还是一种计算机语言?对搜索引擎而言是无法判断的。搜索引擎不是全能的“导游”,而是非常机械的,当你用关键词搜索的时候,它只会把含有这个关键词的网页找出来,更本不管网页上的内容是什么。因此,你只能针对不同的需要去设计较好的关键字进行搜索。(5)信息滞后性。信息更新慢,大部分都是陈旧的信息,无法满足用户的需求。解决这些矛盾的基本方法是变无序数据为有序的知识,让计算机理解Web信息,即语义Web。语义Web(SemanticW

6、eb)旨在使Web上的文本信息具有计算机系统可以理解的语义。这一概念由万维网之父,英国人TimBerners-Lee提出。1980年,他在瑞士日内瓦欧洲粒子物理实验室(CERN)工作时提出全球性的超文本系统,其Ii{『身是写一个程序,用于连接文字、图像、音乐和活动影像,实现与同事相互交换资料,二辅助他的物理研究,后来发展成为万维网。万维网已成为人们获取知识的主要的手段。1.3本文研究的目的和研究内容1.3.1研究目的造成上述问题的实质在于传统信息检索算法所采用的只是基于语法层面上字、词苹十Ontology的智能竹息榆索关键技术研

7、究的简单匹配,而缺乏对知识的表示、处理和理解能力。解决这些问题的关键在于把信息检索从基于关键字的语法匹配提升至基于知识(或上下文)层面的语义匹配。因此,本文的主要研究目的就是希望通过赋予待检索信息的具体语义内涵,来解决传统信息检索过程中所存在的的问题,以提高检索的质量和效率。1.3.2研究内容从上面的阐述可知,“智能信息检索研究具有很高的学术理论意义和非常广阔的应用前景。本文在前人的研究基础上,主要做了以下几个方面的工作:(1)深入分析了各种传统信息检索的优缺点;(2)深入研究了智能信息检索系统模型中所涉及的本体构建、关联搜索、

8、减少响应时间和语义门户等关键技术;首次提出关联搜索的概念,并初步用贝叶斯网络解决了这个问题:同时又采用了语义门户技术和RIA技术在某种程度E解决了响应时间问题。(3)并用贝叶斯概率模型优化了概率相似度的排序算法;1.4本文的章节安排全文共由七章组成。第一章为绪论

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。