基于最优搜索理论的信息检索系统研究

基于最优搜索理论的信息检索系统研究

ID:34151461

大小:4.19 MB

页数:61页

时间:2019-03-03

基于最优搜索理论的信息检索系统研究_第1页
基于最优搜索理论的信息检索系统研究_第2页
基于最优搜索理论的信息检索系统研究_第3页
基于最优搜索理论的信息检索系统研究_第4页
基于最优搜索理论的信息检索系统研究_第5页
资源描述:

《基于最优搜索理论的信息检索系统研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、电子科技大学硕士学位论文架图和核心模块的类图、负责编码并实现原型系统中的关键子模块⋯一信息检索子模块和信息重组子模块。最后负责仿真实验的组织、数据收集和数据对比,验证基于最优搜索理论的信息检索系统能够一定程度上提高检索系统的效率。1.3本文的组织本文的后序章节内容组织如下:第二章主要介绍信息检索背景、信息检索中影响搜索性能的因素、网络结构模型对检索系统性能的影响、现今网络系统开发典型技术介绍。第三章主要介绍最优搜索理论,其组成要素和问题分类的方法。第四章研究并提出四种可选的系统适用的网络结构模型,并以仿真和实验为依据找到

2、信息检索系统最终采用的搜索网络结构模型。第五章设计了基于最优搜索理论的信息检索系统的总体框架、系统总体类图结构,并有重点地详细讨论系统核心部分的设计,最后从网络模型结构角度研究适用于聚类特性无结构对等网络模型的最优搜索策略。第六章讨论了基于最优搜索理论的信息检索系统各部分的具体实现。对系统进行测试,并通过对比试验,验证采用了最优搜索策略对信息检索系统检索性能的优化结果,并对比应用无结构对等网络模型和不应用该模型对系统的优化情况,并给出分析。第七章对全文进行总结,指出尚未考虑到的问题和下一步的研究方向。4第二章基丁最优搜索

3、理论的信息检索系统研究背景第二章基于最优搜索理论的信息检索系统研究背景2.1多媒体信息检索知识概括多媒体信息检索一直是信息检索领域中倍受关注的一个分支,具体来说多媒体信息检索包括视频检索,音频检索,图片检索等信息检索。由于多媒体信息自身固有的特殊性,检索过程中不能简单地使用正向匹配等算法实现对其的检索,现在提出有的多媒体信息检索的方法和策略主要有:适应性最优搜索策略、hlcludeQue搿Te彻、ExcludeQuewTe彻、非适应性最优搜索策略、URLSearch(t锄)、URLSearch(a11)、搜索网络上的密集

4、查找搜索策略、TitleSearch(term)、TitleSearch(a11)、搜索网络上的随机游走搜索策略、PllraseSea“Ih、BooleanoRSea“湘、SiteRestrictedSearch、DateRestrictedSearch、CachedResultsPage等搜索策略【3J。2.2最优搜索理论应用到信息检索领域最优搜索理论所具有的在军事、经济等各个领域的特殊贡献不得不让研究考虑能否将最优搜索理论引用进多媒体信息检索中,事实上这样的构想是可以通过具体技术来实现的。最优搜索理论能够为搜索系统提

5、出一种方案来实现从搜索资源中按照一定算法分类查找需求资源,这里的方案其实是一种序列,把待搜索的资源按照一定的权值放到特殊序列中,在这样的序列中通过依次排查来找出需求资源。这就是应用最优搜索理论到信息检索领域最基本的原则,由于检索领域面对的是浩瀚的互联网信息库,所以这个待搜索的资源范围就很大,同时待搜索的资源也很多,而如果把这样的所有待搜索的资源按照原定计划进行序列化的话,势必耗费的时间和存储空间都很大,故而针对所有互联网上的搜索资源序列化方法不现实。于是有了分类查找的思想,信息检索针对的是一类或几类特殊的信息,例如文本信

6、息,图形信息,视频信息等等,有了具体的分类则可以大大缩小信息检索5电子科技大学硕士学位论文针对的待搜索资源的范围,再应用最优搜索理论必定可以大大提高信息检索的效率。以上就是目前信息检索领域中应用最优搜索理论的基本思路,具体实现要根据系统的实现背景和应用背景而有所区别。2.2.1从信息检索对象化分类的角度应用最优搜索理论信息检索领域中根据检索的目的和针对的用户种群,可以简单从对象角度将搜索工作分成整合搜索和个性化搜索或者叫个人化搜索。个性化搜索(personalizedsearcll/searchpersonalizati

7、on),指的是搜索引擎根据用户搜索的历史记录,来返回更适合这个用户的搜索结果。这些搜索历史记录包括用户所搜索的关键词,在搜索结果中的点击情况,在搜索系统中各中分类下的访问情况,书签情况等。搜索引擎系统掌握了这些客户端的用户资料后进行分析,在用户搜索新的关键词时,能返回更有针对性的搜索结果,从而提高系统的用户体验。进一步说明可以参照互联网现今的主流搜索引擎:G00酉e,Powerset,spock,Willl(,Like,Thefind.com,Ugenie,Medio。比如在使用Goo百e时,如果用户登录了任何Goo西e

8、帐户,并且没有关掉webhisto珂,那么用户的搜索访问历史都会被G∞西e记录。而Coll撕田是一个个性化搜索引擎,专注于个性化搜索结果。因为它从用户过去的搜索习惯整合了资料,例如搜索“Java’’,搜索引擎应该知道用户到底是更喜欢这种计算机语言呢还是那种叫“JaVa’,的咖啡,而在西obal的位置上,在这个区域搜索

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。