欢迎来到天天文库
浏览记录
ID:36583436
大小:3.67 MB
页数:60页
时间:2019-05-12
《基于元搜索的网站排名系统的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、哈尔滨工业大学工程硕士学位论文工程硕士学位论文基于元搜索的网站排名系统的设计与实现伍伟略哈尔滨工业大学2008年6月-53-哈尔滨工业大学工程硕士学位论文国内图书分类号:TP309.5国际图书分类号:621.3工程硕士学位论文基于元搜索的网站排名系统的设计与实现硕士研究生:伍伟略导师:刘挺教授副导师:古煜中高级工程师申请学位:工程硕士学科、专业:软件工程所在单位:软件学院答辩日期:2008年6月授予学位单位:哈尔滨工业大学-53-哈尔滨工业大学工程硕士学位论文ClassifiedIndex:TP3
2、09.5U.D.C.:621.3DissertationfortheMaster’sDegreeinEngineeringTHEDESIGNANDIMPLEMENTATIONOFWEBSITERANKINGSYSTEMBASEONMETASEARCHCandidate:WuWeilueSupervisor:Prof.LiuTingAssociateSupervisor:Sr.EngineerGuYuzhongAcademicDegreeAppliedfor:MasterofEngineeringS
3、pecialty:SoftwareEngineeringAffiliation:SchoolofSoftwareDateofDefence:June,2008Degree-Conferring-Institution:HarbinInstituteofTechnology-53-哈尔滨工业大学工程硕士学位论文摘要随着互联网的快速发展,网站数量也越来越多。对于同一领域的网站,人们由于商业上的需求,例如广告的投放等目的,对网站的关注程度进行对比,从而产生了网站排名的需求。本文通过利用元搜索的技术,搜集
4、与某一领域内相关的网站信息,根据成员搜索引擎的排名,产生来源于搜索引擎的网站排名,同时获取Alexa和ChinaRank的排名顺序,最后生成具有客观意义综合排名。到目前为止,互联网存在着多种排名的规范,较为著名的有全球范围排名的Alexa和中国大陆的中文网站排名ChinaRank。目前它们都是通过安装在客户端的工具条来统计网站的流量从而得出网站的排名,都具有相当的权威性,但是由于各种的原因,如工具条的覆盖面不足,主观排名作弊等,导致结果出现偏差,不同的排名之间进行对比,也会发现,排名结果存在差异。
5、本系统的目的是产生这样的一个排名,它可以在几种现有的排名之上,产生一个新的综合排名,能够消除之间的差异,使结果更为客观。同时,本文还应用元搜索的技术,实现了网站排名的动态实现,用户可以按照某一相关领域的网站进行实时排名,目前这是互联网的空白。本文介绍了基于元搜索的网站排名设计和实现方法,并对各个成员搜索引擎的网络爬虫、页面结构和页面信息抽取方法进行分析,提出了搜索引擎排名和综合排名的概念及实现的方法,最后通过程序设计语言来实现。关键词元搜索;网站排名;网络爬虫;信息抽取-53-哈尔滨工业大学工程硕
6、士学位论文AbstractWiththerapiddevelopmentoftheInternet,thenumberofsiteshasbeenincreasingveryfast.Inthesamefieldsite,becauseoftheneedsofbusiness,suchasadvertisingpurposes,peoplelaunchofthewebsitecomparingthedegreeofconcern,resultinginthedemandforthewebsiter
7、ankings.Inthispaper,throughtheuseofmeta-searchtechnology,collectrelatedsitesinthesamefield,andaccordingtotherankingofsearchenginemembers,generatethewebsiterankingfromsearchenginemembers,atthesametimegetChinaRankandAlexarankingstoformacomprehensiveobje
8、ctivesignificanceranking.Sofar,thereisavarietyofInternetrankingnorms,themorewell-knownareglobalrankingAlexaandChinesewebsiterankingChinaRank.Theyarecurrentlyinstalledinthebrowerthroughthestatisticaltoolsofthewebsitetodrawtraffictothewebsiteran
此文档下载收益归作者所有