试论distancerank与hits混合的网页排序算法研究

试论distancerank与hits混合的网页排序算法研究

ID:34798558

大小:1.07 MB

页数:34页

时间:2019-03-11

试论distancerank与hits混合的网页排序算法研究_第1页
试论distancerank与hits混合的网页排序算法研究_第2页
试论distancerank与hits混合的网页排序算法研究_第3页
试论distancerank与hits混合的网页排序算法研究_第4页
试论distancerank与hits混合的网页排序算法研究_第5页
资源描述:

《试论distancerank与hits混合的网页排序算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代码:分类号:东北h予尬大雪硕士学位论文DistanceRank与HITS混合的网页排序算法研究RankingWebPageswithanApproachofMixingDistancelhnkandHITlS作者:柳淑升指导教师:学科专业:研究方向:学位类型:姜华教授计算机应用技术Web挖掘学历硕士东北师范大学学位评定委员会201O年6月^:’独创性声明本人郑重声明:所提交的学位论文是本人在导师指导下独立进行研究工作所取得的成果。据我所知,除了特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过

2、的研究成果。对本人的研究做出重要贡献的个人和集体,均已在文中作了明确的说明。本声明的法律结果由本人承担。学位论文作者签名:律午三牛日期:2:型丝么皿学位论文使用授权书本学位论文作者完全了解东北师范大学有关保留、使用学位论文的规定,即:东北师范大学有权保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权东北师范大学可以采用影印、缩印或其它复制手段保存、汇编本学位论文。同意将本学位论文收录到《中国优秀博硕士学位论文全文数据库》(中国学术期刊(光盘版)电子杂志社)、《中国学位论文全文

3、数据库》(中国科学技术信息研究所)等数据库中,并以电子出版物形式出版发行和提供信息服务。(保密的学位论文在解密后适用本授权书)学位论文作者签名:日期:学位论文作者毕业后去向:工作单位:通讯地址:指导教师签名:}呼电话:邮编:摘要随着计算机应用的迅速发展,Web的规模呈现爆炸式增长。搜索引擎作为人们网上冲浪必不可少的工具,得到了空前的发展。为了更好的完善搜索引擎的功能和性能,为人们上网时提供更多的方便,也为了更好的实现其商业价值,越来越多的人开始投入到搜索引擎的改进和提高上,作为搜索引擎的核心算法搜索排序算法更是

4、变得炙手可热。为了方便叙述,本文就将搜索排序统称为排序。本文要讨论的就是网页的排序问题。现在的网页排序算法虽多,但各有利弊。考虑到各种算法的长短,我们采用一种取长补短的方法——将两种性质不同的方法进行结合,以获取一种可以尽量扬长避短的新算法。HITS算法作为一种基于查询的排序算法,正受到人们越来越多的重视;而DistanceRank算法作为一种基于强化学习的离线全局排序算法刚被提出不久,有着优异的性能和良好的发展潜力。基于上述考虑,本文将DistanceRank改进成一种基于查询的算法QDistanceRank

5、(Query.dependentDistanceRank),并将这种算法与HITS算法进行结合,得到了另一种算法,我们称之为QDRHITS(QDistanceRankandHITSAlgorithm)。本文算法的采用Java语言实现,在实验过程中借助经典PageRank算法对算法性能进行评估。实验结果表明,作为基于查询的排序算法,本文的两种方法在网页排序质量方面要优于经典的HITS算法。关键字:DistanceRank:HITS;QDRHITS;QDistanceRank;PageRank;网页排序Abstra

6、ctWiththerapiddevelopmentofcomputerapplications,Webscaleshowingexplosivegrowth.Searchengineasindispensabletoolforpeopletosurftheweb,hasbeenallunprecedenteddevelopment.Inordertobetterimprovethesearchenginefunctionalityandperformanceforpeopletoprovidemoreconve

7、nientaccess,aswellastobetterachievetheircommercialvalue,moreandmorepeoplebegantoputintoasearchengine.Thesearchingandrankingalgorithmwhichisthecorealgorithmofsearchengineisbecominghot.Tobeconvenienttoaddress,thesearchingandrankingalgorithmCallbecalledrankinga

8、lgorithmforshort.Inthisarticlewewilldiscussrankingalgorithmsofsearchengine.Althoughtherearemanyrankingalgorithms,theyhavemanyadvantagesanddisadvantages.Takingitintoaccountthattheadvantagesanddis

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。