欢迎来到天天文库
浏览记录
ID:33567135
大小:4.34 MB
页数:69页
时间:2019-02-27
《基于访问路径挖掘的web缓存与预期模型研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、国内图书分类号:TP3国际图书分类号:004西南交通大学研究生学位论文密级:公开年姓专二。一四年五月ClassifiedIndex:TP3U.D.C:004SouthwestJiaotongUniversityMasterDegreeThesisResearchonWebCacheandPrefetchingModelBasedonAccessPathMiningGrade:2011Candidate:WangWenjianAcademicDegreeAppliedfor:MasterSpeciality:ComputerApplicationTech
2、nologySupervisor:TaoHongcaiMay,2014西南交通大学学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权西南交通大学可以将本论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复印手段保存和汇编本学位论文。本学位论文属于1.保密口,在——年解密后适用本授权书;2.不保密囹,使用本授权书。(请在以上方框内打“4’’)学位论文作者签名:城日期:2014年箩月10日⋯躲啕彭西南交通大学硕士学位论文
3、主要工作(贡献)声明本人在学位论文中所做的主要工作或贡献如下:(1)改进WAP算法,在构造算法模式树时加入对Web对象时间局部性的考虑,并且在挖掘过程中避免产生大量条件树,使得新的IWAP算法更加适用于缓存替换算法的决策。(2)提出一种新的预取模型。本文提出的加入权值信息的预取模型,预测队列中的项会被计算权值,该权值由该对象在未来访问序列中出现的次数和位置决定,该权值为替换算法提供了决策的依据。(3)提出一种新的基于预测的缓存替换算法IWAP.GDSF。该算法在经典的GDSF算法基础上使用本文提出的预取模型,计算替换算法的目标函数时加入了预测机制,以此
4、来提高缓存替换算法的文档命中率和字节命中率。(4)实现了一个缓存替换的仿真系统。该系统可以模拟用户访问时的缓存替换过程。使用该系统对GDSF算法和IWAP.GDSF算法进行了仿真实验,对比两种算法的文档命中率和字节命中率,并对结果做出分析。本人郑重声明:所呈交的学位论文,是在导师指导下独立进行研究工作所得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中作了明确说明。本人完全了解违反上述声明所引起的一切法律责任将由本人承担。学位论文作者签名:坡日期:劬I协r同L口4
5、西南交通大学硕士研究生学位论文第1页摘要随着互联网的发展,尤其移动互联网的发展,Web用户快速增长。但因网络带宽和服务器的数量增长相对滞后,造成了用户使用互联网服务的时间延迟。由于硬件投入的成本较大,缓存系统因此成为解决网络延迟的有效方式。缓存替换算法对缓存系统的性能有较大影响。本文在对经典的GDSF替换算法进行研究的基础上,结合Web日志挖掘生成的预测队列,对GDSF进行改进,提出了基于预测的缓存替换算法——IWAP.GDSF算法,以此来提高缓存算法的命中率。本文首先对Web日志挖掘算法进行研究,在经典的WAP挖掘算法的基础上,结合Web对象的时间局
6、部性特征,对WAP算法进行改进形成IWAP算法,使其更适合替换算法的预取模型使用。通过对IWAP的日志挖掘结果建立预取模型,本文提出了一种新的预取模型,模型中考虑了预测对象未来在预测序列中的位置和计数信息,作为该对象未来被访问概率的权重,模型生成的预测队列为替换算法提供决策依据。结合预测模型,本文提出了基于预测的缓存替换算法——IWAP.GDSF。新算法在计算目标函数权值时使用预测队列,综合考虑对象的访问频率、取回代价以及未来可能被访问的概率,做出替换决策。最后本文实现了仿真程序模拟用户访问情况,对IWAP.GDSF算法和GDSF算法进行实验。实验结果
7、表明IWAP.GDSF算法在一定缓存空间大小时可以有效提高缓存的文档命中率和字节命中率。关键词:缓存替换;预取模型;Web日志挖掘;WAP算法;GDSF算法西南交通大学硕士研究生学位论文第1I页AbstractWiththedevelopmentofInternet,especiallythemobileInternet,theWebusersareincreasingrapidly.Butsincetheincreasementofnetworkbandwithandtheservernumberisrelativelylaggedbehind,it
8、leadstothelatencyofthevisitbyInteractusers.Beca
此文档下载收益归作者所有