基于电子商务日志的web使用挖掘研究

基于电子商务日志的web使用挖掘研究

ID:33748300

大小:3.04 MB

页数:69页

时间:2019-02-28

基于电子商务日志的web使用挖掘研究_第1页
基于电子商务日志的web使用挖掘研究_第2页
基于电子商务日志的web使用挖掘研究_第3页
基于电子商务日志的web使用挖掘研究_第4页
基于电子商务日志的web使用挖掘研究_第5页
资源描述:

《基于电子商务日志的web使用挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中南大学硕士学位论文基于电子商务日志的Web使用挖掘研究姓名:金述强申请学位级别:硕士专业:计算机应用技术指导教师:蒋外文20090522摘要随着Internet的日益普及和电子商务的蓬勃发展,基于电子商务的业务也面临着越来越激烈的竞争。由于电子商务站点可为数据挖掘提供极为丰富的数据源,因而如何运用数据挖掘技术对Web服务器上的日志数据和交易数据进行挖掘,从中抽取感兴趣的模式,以便更好地理解客户的访问行为,或改进站点结构和为客户提供更多的个性化推荐服务,已成为众多商家所关注焦点。因此,开展本研究课题有一定的应用价值和意义。本文首先概述了Web使用挖掘。介绍了日志挖掘技

2、术中两大关键技术一序列模式挖掘和聚类分析,并分析了算法的优缺点,为后面的应用奠定理论基础。接着,详细讨论了Web日志挖掘的数据预处理过程,包括数据净化,用户识别,会话识别,Frame过滤,路径补充等。然后,对传统的矩阵聚类算法进行优化,改进为权值矩阵聚类算法。该算法对用户浏览时间和点击次数两个数据的离散化,来得到加权的URL--UserlD访问矩阵,应用该算法分别对客户和页面的聚类分析,对客户的聚类来发现相似的客户群体,挖掘潜在客户,对页面聚类来将内容相关的页面归类;接下来,通过对聚类分析后的每一类用户访问日志分析,发现每一类用户的MFP事务数据库,再利用GSP算法找

3、出每一类用户的频繁访问路径。最后把聚类和序列模式挖掘结果应用到电子商务推荐系统中,并给出一个个性化推荐系统PRS的原型。实验表明改进的权值矩阵聚类算法具有较高准确性和良好扩展性。将挖掘结果应用于个性化推荐系统的思想是有效的、可行的。关键词:日志预处理,电子商务,权值矩阵聚类,频繁访问路径,个性化推荐系统ABSTRACTWiththepopularizationofIntenretandthedevelopmentofe-commerce,thebusinessofe-commerceareconfrontedwithmoreandmoreintensecompetit

4、ion.E—commercesiteprovidesabundantdatasourcefordatamining,thusmoreandmoremerchantsareconcernonhowtomakeuseofdataminingtechnologywhichcarriesontheexcavationtothewebserverslogdataandthetransactiondata,fromthatextractioninterestpatterninordertobetterunderstandthecustomervisitbehavior,orimp

5、rovessitestructureandprovidesmorepersonalizedrecommendationservicetocustomers.Therefore,tocarryouttheresearchhavecertainapplicationvalueandsignificance.Thepaperfirstoutlinedthewebusagemining.Introducedtwokeytechnologiesofweblogmining--sequentialpatternminingandclusteranalysis,analyzedth

6、eadvantagesanddisadvantagesofthealgorithm,establishedtheoreticalprincipleforthefollowingapplication.Then,detaileddiscusseddatapreprocessingprocessofweblogmining,includingdatacleaning,useridentification,sessionidentification,Framefilter,pathsupplementandSOon.Then,fortraditionmatrixcluste

7、ringalgorithmcarriesontheoptimization,improvedasweightmatrixclusteralgorithm.Thisalgorithmdiscretesbothuserbrowsingtimeanduserclicktimes,toobtaintheweightedvisitmatrix.Separatelytothecustomerandpage’Sclusteranalysis,customerclusterdiscoversthesimilarcustomercommunity,findlatent

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。