基于最优搜索的分布式数据检索技术

基于最优搜索的分布式数据检索技术

ID:33391854

大小:3.23 MB

页数:73页

时间:2019-02-25

基于最优搜索的分布式数据检索技术_第1页
基于最优搜索的分布式数据检索技术_第2页
基于最优搜索的分布式数据检索技术_第3页
基于最优搜索的分布式数据检索技术_第4页
基于最优搜索的分布式数据检索技术_第5页
资源描述:

《基于最优搜索的分布式数据检索技术》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、屯回

2、龟占村技女管硕士学位论文@≯MASTERDISSERTATION沧文题目基于最优搜索的分布式数据检索技术学科专业指导教师作者姓名庞默班学号—————上盟壑竖盟盟2_————一摘要随着互联网的迅猛发展,网络信息的增加,用户要在海量的数据信息里查找所需信息,如果没有强有力的信息检索和分析工具几乎是不可能的。当前使用比较普遍的检索系统能部分的解决资源发现的问题,但随着网络数据量急剧膨胀,传统的集中式信息检索方法在搜索性能上已经无法满足用户的要求。当信息的检索规模达到一定的程度时,必然要采用分布式的方法,以提高系统性能。分布式数据检索技术的提出对信息检索领域具有极其重大的意义

3、。与传统的信息检索技术相比,使用分布式数据检索技术的检索系统在检索效率上有了大幅的提高。而如何进一步在分布式数据检索技术的基础上提高其检索效率,是一个值得研究的课题。最优搜索理论是二战时期发展起来的学科,是计算统筹学的分支,它研究在有限的资源约束条件下,如何分配资源使得成功搜索到目标的可能性最大或者资源的消耗最小。利用最优搜索理论对分布式数据检索进行优化,将提高系统的检索质量。本文在研究了分布式数据检索技术和最优搜索理论的相关知识的基础上,进一步重点研究了最优搜索理论与分布式数据检索技术的结合。首先利用最优搜索理论建立分布式数据检索系统的数学模型,分析最优搜索模型的初始概率

4、分布并研究初始概率调整的方法,再根据系统模型的特征确定探测函数的形式。然后在搜索时间有限的约束条件下,制定最优搜索策略,使得目标的检索概率达到最大,并且在用户搜索结果数固定的情况下,使检索的时间期望值达到最小。最后还研究了初始概率分布对探测概率造成的误差值。另外,本文还根据分布式数据检索系统的模型设计并实现了基于最优搜索理论的分布式数据检索系统。之后在该系统上进行了一系列的实验,讨论了各检索服务器的检索次序以及系统运行一段时间后初始概率分布的调整对系统性能的影响。并通过查准率和查询时间两个方面对传统的分布式检索系统和基于最优搜索理论的分布式检索系统进行比较评价,证实了最优搜

5、索理论对分布式数据检索系统具有明显的优化效果。关键词:最优搜索理论,分布式系统,信息检索,时间资源ABSl民气CTABSTRACTWiththerapiddevelopmentofintemetandtheincreaseofinformationininternet,itseemsimpossibleforUSeStosearchtheinformationtheyneedfromlargemountofdatawithoutpowerfulretrievalandanalysistools.Atpresent,thewidelyusedretrievalsystemca

6、llsolvetheproblemofresourcediscoveringpartially,However,withtherapidexpansionofnetworkdataresources,traditionalC/Sretrievalmethodhasbeenunabletomeettheuser'srequirementsinperformanceofsearch.Ⅵmenthescaleofinformationretrievalreachesacertainextent,itisnecessarytoadoptdistributedapproachtoim

7、provesystemperformance.Bringingforwardtechnologyofdistributeddataretrievalisofgreatsignificancetothefieldofinformationretrieval.Comparedwiththetraditionalinformationretrievaltechnologies,theefficiencyofsearchretrievalsystemwhichUsesdistributeddataretrievaltechnologyisimprovedsignificantly.

8、Thenhowtoimprovetheretrievalefficiencyonthebasisofdistributeddataretrievaltechnologyisatopicworthresearching.OptimalsearchtheorydevelopedduringWorldW缸II,itisabranchofstatisticaldecisiontheoryinoperationsResearchwhichstudieshowtodistributeresourcesinordertosear

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。