资源描述:
《【论文】基于Web日志的实时推荐模型研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、工程硕士学位论文基于Web日志的实时推荐模型研究AReal-TimeRecommendationModelBasedonWebLog摘要随着WWW的广泛应用,在WWW服务器上聚集了大量的Web日志,这些数据在很多领域中都至关重要,如Web站点的系统设计、商业市场策略和网站个性化等等。实时推荐就是数据挖掘在Web日志数据中的一个应用,其目的是方便用户对网站的访问,可以预测用户的喜好,并为电子商务提供决策依据。本文在概述Web挖掘以及Web日志挖掘的相关领域的发展和技术及其理论基础上,详细研究了Web日志挖掘的预处理技术,使用一个基于页面访问时间阈
2、值与会话重组的会话识别算法,并通过实际的Web日志数据加以验证;在数据预处理的基础上,利用模糊聚类技术,根据用户对Web页面的浏览情况分别建立Web用户和Web页面的模糊集,然后用最大-最小法的模糊相似性度量构造模糊相似矩阵,并由此构造了模糊动态聚类算法;在上述工作的基础上,设计了一个基于Web日志挖掘的实时推荐模型系统RTRS(real-timerecommendationsystem)。它分为离线部件和在线部件两部分,其中,前者进行数据收集、预处理、用户和页面的模糊聚类;后者根据用户当前访问行为生成推荐集,它采用的推荐算法是通过用户的访问记
3、录构造BP树(BrowsPatternTree),产生频繁访问集,从而生成推荐集,该算法只需扫描数据库一次,得到的频繁序列模式可以满足实时推荐的快速需求。该论文有图10幅,表7个,参考文献52篇。关键词:数据挖掘;数据预处理;会话识别;模糊聚类;实时推荐AbstractWiththeextensiveuseofWWW,theWWWserverhasassembledalargenumberofWeblogs,thesedataarecrucialinmanyfields,suchastheWebsite,systemdesign,busines
4、smarketingstrategiesandWebsitepersonalizationandsoon.Real-timerecommendationisaWebapplicationofdatamininginlogdatainwhichaimstofacilitateuserstoaccessthesite,youcanpredicttheuser'spreferences,andofferbasis.formakinge-commercedecision.Onthebasisofanoverviewofrelatedareasofdev
5、elopmentandtechnologyaswellastheoreticalbasisofWebminingandWeblogmining,thispapermadeadetailedstudyoftheWeblogminingpreprocessingtechniques,usingathresholdbasedonpageaccesstimeofthesessionwithasessionre-recognitionalgorithm,inspectingandverifyingthroughtheactualWeblogdata,on
6、thebasisofthedatapreprocessing,usingfuzzyclusteringtechnique,establishingWebusersandWebpagesofthefuzzysetbasedonuserbrowsingofWebpages,thenusingthemaximum-minimizationoffuzzysimilaritymeasuretoconstructfuzzysimilarmatrixsoastoconstructfuzzydynamicclusteringalgorithm.Basedont
7、heabove-mentionedwork,thepaperdesignedareal-timerecommendationmodelsystemRTRS(real-timerecommendationsystem)basedonWeb-logminingthatisdividedintotwoparts,offlinepartandonlinepart,inwhichtheformerisfordatacollection,preprocessing,userandpageofthefuzzyclustering;andthelatteris
8、formedintorecommendationset,accordingtousercurrentaccessbehavior,forthereco