基于两级修正的页面排序改进算法-论文.pdf

基于两级修正的页面排序改进算法-论文.pdf

ID:58298421

大小:641.09 KB

页数:5页

时间:2020-05-04

基于两级修正的页面排序改进算法-论文.pdf_第1页
基于两级修正的页面排序改进算法-论文.pdf_第2页
基于两级修正的页面排序改进算法-论文.pdf_第3页
基于两级修正的页面排序改进算法-论文.pdf_第4页
基于两级修正的页面排序改进算法-论文.pdf_第5页
资源描述:

《基于两级修正的页面排序改进算法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、2014年6月计算机工程与设计June2014第35卷第6期COMPUTERENGINEERINGANDDESIGNVoL35No.6基于两级修正的页面排序改进算法刘恩海,张梅芳,李天义。,梁慧。,穆立(1.河北_r--_,Ik大学计算机科学与软件学院,天津300401;2.93642部队,河北唐山064000;3.空军预警学院黄陂士官学校训练部,湖北武汉432200;4.空军93756部队电子教研室,天津30O130)摘要:经典的PageRank算法主要根据网页间链接结构进行分析排序,容易产生主题漂移、偏重旧网页、平均分配网页权值、忽视用户兴趣等问题。为了改进上述缺陷,提出一种基于两级修

2、正的页面排序改进算法。综合利用网页相似度、点击量趋势、站内外链接、时间因子对网页的排序值进行一级修正;在此基础上结合用户兴趣对查询结果的排序值进行二级修正,使网页重要性权值计算更为合理;组织毕业生、在校生、教师3组人群进行实验调查,实验结果表明,与传统Page-Rank算法相比较,改进后算法的排序结果查准率更高,更满足用户的需求。关键词:两级修正;PageRank;相似度;点击量趋势;权威性;时间维;用户兴趣中图法分类号:TP393文献标识号:A文章编号:1000—7024(2014)06—2024—05Improvedrankingalgorithmbasedontwo—stagecor

3、rectionLIUEn-hai,ZHANGMei—fang,LITian-yi,LIANGHui。,MULi(1.SchoolofComputerandSoftware,HebeiUniversityofTechnology,Tianjin300401,China;2.PLA93642Troops,Tangshan064000,China;3.TrainingDepartmentofHuangpiOfficerSchool,CollegeoftheAirForceEarlyWarning,Wuhan432200,China;4.ElectronicStaffRoom,AirForce93

4、756Troops,Tianjin300131,China)Abstract:ClassicPageRankalgorithmanalyzedthesortofpagesmainlybasedonlinkstructureofwebpages,SOthisalgorithmeasilyleadtotopic-drift,emphasisonoldpages,evenlydistributedwebweight,ignorunceoftheuserinterestandotherissues.Toovercomethesedefects,animprovedrankingalgorithmb

5、asedontwo-stagecorrectionwasproposed.Firstly,usingthewebsimilarity,clicktraffictrends,authority,andthetimefactorstocorrecttherankingvalueofwebpage.Then,onthesebasis,combiningwithuser'sinteresttoconductthesecondarycorrectionforthequeryresults.Itcouldmakethewebpagesimportanceofweightcalculationmorer

6、easonable.Atlast,theexperimentwasconductedbythreegroupsincludinggraduates,studentsandtheteachers.Theexperimentalresultsshowedthat,comparedwithconventionalPageRankalgorithm,theimprovedalgorithmhashigherprecision,andbettermettheneedsofusers.Keywords:two-stagecorrection;PageRank;similarity;clicktraff

7、ictrends;authoritative;timefactors;userinterests要程度及出度的分析来区分网页权值的传递概率。但这几0引言种算法只是简单的针对PageRank存在的某一点不足进行改传统的PageRank算法存在主题漂移、偏重旧网页歧视进,且并未考虑用户兴趣在网页排序中的影响。丁岳伟新网页、平均分配网页权值、忽视用户兴趣等缺陷。针对等[5通过将信息熵的概念将用户的群体选择加入到网页权上述问题,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。