搜索引擎排序算法研究(1)

搜索引擎排序算法研究(1)

ID:33772097

大小:2.16 MB

页数:49页

时间:2019-03-01

搜索引擎排序算法研究(1)_第1页
搜索引擎排序算法研究(1)_第2页
搜索引擎排序算法研究(1)_第3页
搜索引擎排序算法研究(1)_第4页
搜索引擎排序算法研究(1)_第5页
资源描述:

《搜索引擎排序算法研究(1)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、长春理工大学硕士学位论文搜索引擎排序算法研究姓名:李健申请学位级别:硕士专业:计算机应用技术指导教师:全吉成20100301摘要互联网的出现和迅速发展使信息检索的环境发生了重大变化,网页数量的暴涨,使人们快速准确的获取信息的难度增大。在这种背景下,搜索引擎成了人们不可或缺的信息检索工具。但搜索引擎返回的网页数量往往很大,如何让用户在大量的返回结果中迅速找到最准确的信息,则显得尤为重要。而搜索引擎的网页相关性排序算法,就能够决定用户是否能在排序靠前的网页中找到想要的信息,因此排序算法直接影响搜索引擎的使用体验,决定了搜索引擎的实用性。现有的搜索引擎排序算法,以基于网页链接结构的

2、算法为主,主要的两种代表性算法是PageRank算法和HITS算法,基于这两种算法国内外许多学者和研究机构进行了不断的探索和改进。本文研究在分析国内外搜索引擎发展的基础之上,对经典排序算法进行了深入分析(如PageRank和HITS),将国内外现有的改进算法进行了归纳和总结,并针对ARC算法(改进的HITS算法)的特点和不足,提出基于链接相似度的改进算法,并利用贝叶斯概率模型推导出简化方法。然后建立搜索引擎实验平台,对基于链接相似度的ARC算法进行了验证,实验结果表明改进的ARC算法有效控制了主题漂移,提高了搜索引擎性能。.关键字:搜索引擎排序算法川TSARC算法主题漂移AB

3、STRACTTheemergenceandrapiddevelopmentoftheInternettomakeinforillationretrievalenvironmenthaveundergonesignificantchangesintheskyrocketingnumberofpages,SOthatpeopleaccurateaccesstoinformationmoredifficult,inthiscontext,searchenginesbecomeanindispensableinformationretfievaltoolforpeople,butth

4、enumberofpagesreturnedbysearchenginesisoftenmassive,andhowtogetuserstomassspeedyreturnofresultstofindthemostaccurateinformation,itisparticularlyimportant.Thesearchengine’Swebsiterelevancesortingalgorithm,weCalldeterminewhethertheusercanfindthetop—rankingwebpagesyouwantinformation,SOsortinga

5、lgorithmssearchenginesuseadirectimpactonexperience,determinetheusefulnessofsearchengines.Existingsearchenginerankingalgorithms,web—basedlinkstructureofthealgorithmisbased,themaintwokindsofrepresentationofthealgorithmisPageRankalgorithmandtheHITSalgorithm,basedonthesetwoalgorithmsmanyscholar

6、sandresearchinstitutionsathomeandabroadhasconductedanewexplorationandimprovement.Thispaperanalyzesthedevelopmentofsearchenginesathomeandabroad,onthisbasis,theclassicalsortingalgorithmsin-depthanalysis(suchasPageRankandHITS),willbeathomeandabroadtoimprovetheexistingalgorithmsaresummarizedand

7、reviewed.andfortheARCalgorithm(theimprovedHITSalgorithm)thecharacteristicsandshortcomings,proposelink-basedsimilarityoftheimprovedalgorithm,anduseBayesianprobabilitymodeltoderivesimplifiedmethod.Thenintheestablishmentofsearchengineexperimentalplatform,th

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。