欢迎来到天天文库
浏览记录
ID:32986740
大小:2.92 MB
页数:43页
时间:2019-02-18
《基于web日志挖掘的个性化服务技术的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、湖北工业大学硕士学位论文基于WEB日志挖掘的个性化服务技术的研究姓名:熊熙申请学位级别:硕士专业:计算机应用技术指导教师:王大震20100501湖北工业大学硕士学位论文摘要随着互联网的迅速普及和广泛应用,网络信息资源的数量及网站设计的复杂度也呈急剧增长趋势。一方面,人们越来越多地关注如何快速有效地从繁多的网络信息中寻找到潜在的、有价值的信息。另一方面,Web网上的服务商也在不断设法获取用户浏览的兴趣爱好,以便为用户提供更有针对性的服务。但是由于Web是动态的无结构的,并且Web页面的复杂程度远远大于
2、文本文档。Web日志挖掘就是运用传统的数据挖掘技术和Web技术结合起来,来对服务器日志进行挖掘和分析处理,从海量的信息数据中发现规律性的内容,解决上面提出的各类问题。如今,针对用户特性并向用户提供个性化服务已经成为计算机技术的研究热点之一。运用Web日志挖掘技术,并结合Web站点的内容、语义信息是目前基于Web日志挖掘的个性化服务技术研究的新趋势。本文首先简述了Web日志挖掘的概念、应用、研究现状和研究目前所面临的问题,重点分析了Web日志挖掘系统的实现过程,给出了数据预处理的流程并分析了其中的难点
3、;其中预处理过程包括数据清洗、用户识别、会话识别和路径补充。其次研究了用于Web日志挖掘技术的算法。提出了一种新的预处理模型,采用基于分析用户方cookies文件的技术方法,避免通过同一代理服务器访问网站的不同用户无法识别出来。采取了用户浏览行为的聚类算法与Web页面聚类算法相结合的方法对用户访问模式进行挖掘,直接对网站的拓扑结构和用户浏览信息进行处理的关联矩阵方法,避免了复杂的会话识别,使挖掘过程更高效多能。再次描述了个性化服务的关键技术,并形成了个性化服务推荐系统。通过之前用户访问模式挖掘,预测
4、用户感兴趣的页面,形成推荐结果,并以增加动态链接的方式把指向这些页面的链接推荐给用户,对不同用户展现不同的网站页面,实现个性化服务。文中给出了系统模型的体系结构,阐述了各模块的用途。最后分析总结了个性化服务的应用和发展方向。关键词:Web日志挖掘,聚类算法,个性化服务I湖北工业大学硕士学位论文AbstractWiththerapidpopularizationandextensiveapplicationoftheinternet,theamountoftheweb-basedinformation
5、andthecomplexityofthesitedesignalsoshowsasharpgrowthtrend.Ontheonehand,itismoreandmoreconcernedabouthowquicklyandefficientlytofindpotentiallyvaluableinformationfromarangeofthenetworkinformation.Ontheotherhand,webserviceprovidersarealsoconstantlytryingt
6、ogettheinterestsandhobbiesoftheusersinordertoprovidethemwithmoretargetedservices.However,webpagesarefarmorecomplexthanthetextdocumentbecausewebisdynamicandunstructured.Weblogminingcombinesthetraditionaldataminingtechniqueswithwebtechnologiestocarryoute
7、xcavationandanalysisontheserverlog,anddiscoverassociationrulesfromthevastamountsofinformationdatatoaddressthevariousissuesraisedabove.Now,focusingonuserfeaturesandprovidingpersonalizedservicehasbeenaresearchofhotspotinwebtechnologies.Theapplicationofwe
8、blogminingtechniques,combinedwithWebsitecontentandsemanticinformationisanewtrendofthewebpersonalizedserviceresearchbasedonweblogmining.Thispaperfirstoutlinestheconceptofweblogmining,theapplicationscopeandresearchcontents.Onthebasisofthe
此文档下载收益归作者所有