欢迎来到天天文库
浏览记录
ID:58298421
大小:641.09 KB
页数:5页
时间:2020-05-04
《基于两级修正的页面排序改进算法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、2014年6月计算机工程与设计June2014第35卷第6期COMPUTERENGINEERINGANDDESIGNVoL35No.6基于两级修正的页面排序改进算法刘恩海,张梅芳,李天义。,梁慧。,穆立(1.河北_r--_,Ik大学计算机科学与软件学院,天津300401;2.93642部队,河北唐山064000;3.空军预警学院黄陂士官学校训练部,湖北武汉432200;4.空军93756部队电子教研室,天津30O130)摘要:经典的PageRank算法主要根据网页间链接结构进行分析排序,容易产生主题漂移、偏重旧网页、平均分配网页权值、忽视用户兴趣等问题。为了改进上述缺陷,提出一种基于两级修
2、正的页面排序改进算法。综合利用网页相似度、点击量趋势、站内外链接、时间因子对网页的排序值进行一级修正;在此基础上结合用户兴趣对查询结果的排序值进行二级修正,使网页重要性权值计算更为合理;组织毕业生、在校生、教师3组人群进行实验调查,实验结果表明,与传统Page-Rank算法相比较,改进后算法的排序结果查准率更高,更满足用户的需求。关键词:两级修正;PageRank;相似度;点击量趋势;权威性;时间维;用户兴趣中图法分类号:TP393文献标识号:A文章编号:1000—7024(2014)06—2024—05Improvedrankingalgorithmbasedontwo—stagecor
3、rectionLIUEn-hai,ZHANGMei—fang,LITian-yi,LIANGHui。,MULi(1.SchoolofComputerandSoftware,HebeiUniversityofTechnology,Tianjin300401,China;2.PLA93642Troops,Tangshan064000,China;3.TrainingDepartmentofHuangpiOfficerSchool,CollegeoftheAirForceEarlyWarning,Wuhan432200,China;4.ElectronicStaffRoom,AirForce93
4、756Troops,Tianjin300131,China)Abstract:ClassicPageRankalgorithmanalyzedthesortofpagesmainlybasedonlinkstructureofwebpages,SOthisalgorithmeasilyleadtotopic-drift,emphasisonoldpages,evenlydistributedwebweight,ignorunceoftheuserinterestandotherissues.Toovercomethesedefects,animprovedrankingalgorithmb
5、asedontwo-stagecorrectionwasproposed.Firstly,usingthewebsimilarity,clicktraffictrends,authority,andthetimefactorstocorrecttherankingvalueofwebpage.Then,onthesebasis,combiningwithuser'sinteresttoconductthesecondarycorrectionforthequeryresults.Itcouldmakethewebpagesimportanceofweightcalculationmorer
6、easonable.Atlast,theexperimentwasconductedbythreegroupsincludinggraduates,studentsandtheteachers.Theexperimentalresultsshowedthat,comparedwithconventionalPageRankalgorithm,theimprovedalgorithmhashigherprecision,andbettermettheneedsofusers.Keywords:two-stagecorrection;PageRank;similarity;clicktraff
7、ictrends;authoritative;timefactors;userinterests要程度及出度的分析来区分网页权值的传递概率。但这几0引言种算法只是简单的针对PageRank存在的某一点不足进行改传统的PageRank算法存在主题漂移、偏重旧网页歧视进,且并未考虑用户兴趣在网页排序中的影响。丁岳伟新网页、平均分配网页权值、忽视用户兴趣等缺陷。针对等[5通过将信息熵的概念将用户的群体选择加入到网页权上述问题,
此文档下载收益归作者所有