欢迎来到天天文库
浏览记录
ID:27324301
大小:984.50 KB
页数:36页
时间:2018-12-02
《优秀毕业论文 对Google搜索引擎中网页排序算法的研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、**纺织大学毕业设计[论文]题目:对Google搜索引擎中网页排序算法的研究摘要搜索引擎技术的发展是随着电子技术不断进步的信息数字化和数据网络化的必然产物,网页排序算法一直是搜索引擎的核心技术之一。Google搜索引擎依靠其PageRank机制及收敛算法一直处于该领域的领先地位。本文深入研究PageRank排名算法,从数学的角度来看,发现它能够通过计算一个基于网络连接图的转移概率矩阵的主特征向量(PageRank向量)实现。同时针对网络的复杂情形,对转移概率矩阵作出了修正并分析了修正矩阵的特性。给出了计算主特征向量的数值解法-幂法。利用修正
2、矩阵中链接矩阵的稀疏性,优化了幂法在迭代中的计算量并减少了存储空间.在幂法理论基础上,给出了一种较新的加速收敛的外推法-TheVector-algorithm,最后结合一个现实中的复杂网络的数据测试,验证了该外推法的良好的实际运用效果。关键词:搜索引擎;PageRank;转移概率矩阵;主特征向量;加速收敛;外推法;幂法;TheVector-algorithmABSTRACTWiththedevelopmentofelectronictechnology,thesearchenginetechnologyisbecomingmoreandmo
3、reimportant.GooglesearchenginekeepsonthetopbyitsPageRankandconvergencealgorithm.Wewillseethat,fromthemathematicalpointofview,itcouldbesolvedbycomputingtheprincipaleigenvector(thePageRankvector)ofaTransitionProbabilityMatrixoftheWeb.AccordingtotheWeb’scomplexity,wewillgivet
4、hemodifiedmatrix,andalsoanalyzeitscharacteristics.WewillstudythemathematicalpropertiesofthepowermethodthatcomputingthePageRankvector.WeusethesparseoftheWebmatrixintheiterativematrix,optimizethecomputationofeachiterationandreduceitsstoragespace.TheVector-algorithm,anextrapo
5、lationalgorithmforvectorsequences,isproposedbasedonthepowermethod.Itwillachievethehigherrateconvergenceinthecomputingperformanceofpowermethod.Finally,somesimulationworkofthetheoreticalproofwillbeverifiedbythesatisfiedpracticalresults.Keywords:SearchEngine;PageRank;Transiti
6、onProbabilityMatrix;principaleigenvector;convergenceandacceleration;extrapolation;powermethod;TheVector-algorithm目录1.绪论11.1引言11.2PageRank简介21.3本文的主要内容和结构安排32.基本的PAGERANK模型42.1PageRank的基本概念42.2PageRank的基本模型52.3存在的问题82.3.1悬点(DanglingNodes)82.3.2主特征向量空间不是一维的82.4对上述问题的修正92.4.1
7、对出现悬点的修正92.4.2对的修正103.对PAGERANK问题的求解方法103.1幂法113.2在PageRank上的幂法123.2.1初始优化PageRank矩阵123.2.2幂法的伪代码134.幂法加速144.1外推法144.1.1Thevector-algorithm144.1.2Thevector-algorithm伪代码155.应用165.1对简化的网络进行等级分析165.2对一个现实的复杂网络进行分析186.结语与展望20参考文献221绪论1.1引言当前因特网上有大量站点正在不断地从广大用户当中搜索数据,并利用机器学习和统计
8、方法从中获得需要的信息。Google搜索引擎作为其中的佼佼者,它不仅可以利用网络链接对网页进行排名,而且当其广告被不同的用户选定时,它会持续搜集信息,这使得Google能够更加有
此文档下载收益归作者所有