试析基于web日志挖掘的搜索引擎排序算法的改进

试析基于web日志挖掘的搜索引擎排序算法的改进

ID:35147279

大小:1.71 MB

页数:66页

时间:2019-03-20

试析基于web日志挖掘的搜索引擎排序算法的改进_第1页
试析基于web日志挖掘的搜索引擎排序算法的改进_第2页
试析基于web日志挖掘的搜索引擎排序算法的改进_第3页
试析基于web日志挖掘的搜索引擎排序算法的改进_第4页
试析基于web日志挖掘的搜索引擎排序算法的改进_第5页
资源描述:

《试析基于web日志挖掘的搜索引擎排序算法的改进》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、哈尔滨工程大学硕士学位论文基于Web日志挖掘的搜索引擎排序算法的改进姓名:孙启明申请学位级别:硕士专业:计算机应用技术指导教师:张健沛20070201哈尔滨工程大学硕士学位论文摘要随着互联网技术的迅速发展,人们的生活发生了巨大的变化,信息极度膨胀给入类带来欣喜,但随之而来的问题就是如何更好的利用这些信息.目前,搜索引擎是人们最普遍使用的信息检索工具,由于网络信息量过大,传统的搜索引擎页面排序算法又无法提供个性化搜索结果,目前的搜索引擎仍无法满足用户的需要.针对用户对搜索引擎的个性化服务的需要,本文建立了一种用户个性化兴趣模型,

2、并对各部分的实现算法迸行了分析和设计,同时,基于这一模型,提出了一种搜索引擎页面排序算法PURaak。‘算法改进的核心思想是以效率换取个性化服务。换句话说,多花一点点时间来大幅度的提高搜索引擎的服务质量。将用户模型以及用户投票加入到捧序关键字的计算当中,使页面质量的评价不仅取决于罔页之间的“投票”还取决于用户对页面的评价;使最终的捧序关键字不仅取决于页面本身的质量,还与用户的兴趣偏好有关,从而实现搜索引擎的个性化服务.最后,作者通过实验验证了算法的有效性,并且提出了继续研究的方向,以及可能存在的问题。关键词:搜索引擎;页面捧序

3、算法;个性化;兴趣模型哈尔滨工程大学硕士学位论文AbstractThe删developmentofhtemetbIin铲agreatchangetopeople;Informati∞giv岱people∞tonlyhappiness,butal∞s咄problemsabomhowtouseiLNow-thesearch钮gineisthemostpopularinformati伽retri酬t001.Theperso删infonnati∞scfVi∞ismuchmoreatUllCtivebecausethetradionta

4、lsearch∞ginecan'tp∞Vidcthat跚nri∞andthereistoomuchreflo删onthehtemet.,hall璐i∞tothemcdofsearch饥ginepersonUzed8ervi∞.thea埘1∞putsforwardthearcllitecmreofthepersonalizedusffinterestmodeland龇algofithmsofeachpaaofthesystem黜anatyzedandd鹤i@ed.砒thesainc妇.theauthorputsforwardan

5、ew蛔fithmP_URankforrankjngpagesofasearchenonebasedOnpersonalizedrisermodel.Thekernelmoughtofthejnl—oVeda190响【llminthisthesisis瞰hangingaH坩eefficiencyforpersonafizeS6Tvi∞.m妇words’玳cangreatlyimpmvetheserviceofowcli∞tbyspendmgalitclcmo心time.AppraisingWebp{嘈∞notonlydepend

6、s伽thehypedtnk∞nfigurationbetweenWbbs’butal∞dependson伽咀s吼盯’5Val删on’andthefinaloutcomenot讲lIydepends∞thepagcs’qualitybutalsodepends∞a∞碰粕n髓’spreference.hlhisw觋thesearchalgi∞啪offerpersonalizedservi∞.Atlast,theauthorhasco血咖edthevalidityofthealgofithmicbya叩盱im∞协,brings如rw

7、ardthedirectionofthe删stepofresearchandsonicpD钏alproblems.geyword$:searchengine;algofithmforrankillgpage;indMduation;interestprofile哈尔滨工程大学学位论文原创性声明本人郑重声明:本论文的所有工作,是在导师的指导下,由作者本人独立完成的。有关观点、方法、数据和文献的引用已在文中指出,并与参考文献相对应。除文中已注明引用的内容外,本论文不包含任何其他个人或集体已经公开发表的作品成果。对本文的研究做出重要

8、贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。作者(签字):型!垂2f2日期:剐年/月’13哈尔滨工程大学硕士学位论文1.1研究背景和意义第1章绪论人类目前正处于一个各种信息快速增长的时代,而信息在互联网中的膨胀速度仍在逐步飙升。中国互

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。