基于改进pagerank算法的网页排序问题研究

基于改进pagerank算法的网页排序问题研究

ID:35065359

大小:2.07 MB

页数:54页

时间:2019-03-17

基于改进pagerank算法的网页排序问题研究_第1页
基于改进pagerank算法的网页排序问题研究_第2页
基于改进pagerank算法的网页排序问题研究_第3页
基于改进pagerank算法的网页排序问题研究_第4页
基于改进pagerank算法的网页排序问题研究_第5页
资源描述:

《基于改进pagerank算法的网页排序问题研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、工学硕士学位论文基于改进PageRank算法的网页排序问题研究周秋丽哈尔滨理工大学2016年3月国内图书分类号:TP301工学硕士学位论文基于改进PageRank算法的网页排序问题研究硕士研究生:周秋丽导师:李兰英申请学位级别:工学硕士学科、专业:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2016年3月授予学位单位:哈尔滨理工大学ClassifiedIndex:TP301DissertationfortheMasterDegreeinEngineeringResearchonWebPageRankBasedonImprovedPageRankAlgorithmCandida

2、te:ZhouQiuliSupervisor:LiLanyingAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerScienceandTechnologyDateofOralExamination:March,2016University:HarbinUniversityofScienceandTechnology哈尔滨理工大学硕±学位论文原创性声明,《巧十巧进IaeRank算法的N1:学位本人郑甫声明:此处所捉史的硕.论义g—C》人在导师指导K,巧哈尔滨巧-火学攻读硕学位期巧排巧问题研究,是本问独义进

3、巧研究X作所取利的成巧。踞本人所知,论文中除U巧明部分外不包工作做出克献的个人和架体,含他人己发巧或撰马过的研究成巧。对本文妍究均己化义中W明柳方式注明。本芦明的法体结架将完全山木人承化。作者签知^M期;加年巧日词兩0台多3哈尔滨理工大学硕古学位论文使用授权书Page民ank蔚法的网巧排巧问题研巧》系本人住哈尔滨理I;大学《茲于改进攻读硕」:学伉期间在巧帅巧皆下完成的硕古学位论文。本论文的研免成巧巧哈^*义巧他单位的么义发表。本人完全尔鶴现X大学所巧,本论文的研究内蒋不得^意学校化留并向钉关浪巧」、,问丫解哈尔:火学关^保巧使用学位论义的规化’?木人

4、授化哈尔滨理.1?大学部N化交论文和电子版木,化许论文被盜阅和借阅采用影印,可W公化论文的全郁或部分内、缩印或巧他复制手段保巧论文韓。本学位论义姑干-密朽适用授权B。保密□,化年解不保密。[3巧么Jl上相应方框内打VL:)(:年3口作者雜名:矿n期如追岛獻六/?气期:年巧H巧师综名11;F>占多巧基于改进PageRank算法的网页排序问题研究摘要现今互联网信息技术迅猛发展,似乎在一夜之间,大数据(BigData)变成一个最流行的词汇。用户在利用搜索引擎便捷获取各类信息的同时,也面临着如何从海量数据中剔除那些影响信息检索效率及准确度的冗余信息的问

5、题。在一般情况下,鉴于用户只关注返回目标网页的前几页,因此对搜索结果进行网页排序,改善搜索质量,提高用户满意度显得尤为重要。对于网页,除了文本信息,页面间的链接结构也是人们获取有用信息的重要途径。经典的网页排序算法---PageRank正是使用网页间的链接结构对各网页的权重值进行迭代计算,很大程度上提高了对网页权重计算的精准度。但是PageRank算法仍存在许多待研究及待突破的不足,开展相关研究具有重要应用价值。本文首先阐述了基于MapReduce的PageRank算法的研究背景和意义,然后对该算法的国内外研究现状进行了分析总结。在此基础上,着重分析出算法中影响性能和准确度的关键因素,即

6、迭代次数和“主题漂移”,进而提出了改进算法:子图估算PageRank网页排序算法及个性化智能推荐的权值分配方法。然后对所改进算法进行理论分析,包括算法的迭代次数,时间复杂度和准确性。最后,在MapReduce编程模型上实现PageRank算法及其改进算法,并通过实验数据对比分析证明算法的合理性、有效性。与传统算法相比,改进后的算法时间复杂度低,迭代次数少,准确度较高。关键词网页排序;MapReduce;PageRank算法;子图;用户习性爱好-I-ResearchonWebPageRankBasedonImprovedPageRankAlgorithmAbstractWiththerap

7、iddevelopmentoftheInternetinformationtechnologytoday,itseemsthatovernight,bigdata(BigData)becomesoneofthemostpopularvocabulary.Althoughuserscanobtainallkindsofinformationbyusingsearchenginesconveniently,theyarealsoface

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。