web使用挖掘中用户访问序列挖掘技术研究

web使用挖掘中用户访问序列挖掘技术研究

ID:33385184

大小:5.59 MB

页数:90页

时间:2019-02-25

web使用挖掘中用户访问序列挖掘技术研究_第1页
web使用挖掘中用户访问序列挖掘技术研究_第2页
web使用挖掘中用户访问序列挖掘技术研究_第3页
web使用挖掘中用户访问序列挖掘技术研究_第4页
web使用挖掘中用户访问序列挖掘技术研究_第5页
资源描述:

《web使用挖掘中用户访问序列挖掘技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、西南交通大学硕士学位论文Web使用挖掘中用户访问序列挖掘技术研究姓名:姚亮申请学位级别:硕士专业:计算机应用技术指导教师:朱焱20080501西南交通大学硕士研究生学位论文第1页摘要用户访问序列挖掘是Web使用挖掘中一个重要的研究方向,旨在采用数据挖掘技术对Web日志进行挖掘,发现站点用户的访问兴趣、访问意图等。借助于挖掘结果,网站运营者可以向用户提供个性化推销和站点导航服务,也可以在得到的频繁访问路径上合理放置广告,提高站点广告收入等。站点开发人员可以利用挖掘结果对站点系统或结构进行改进,提高站点访问效率。总之,访问序列挖掘在各种Web站点,尤其是电子商务网站和门户站点有着广

2、泛的应用前景。访问序列挖掘主要包括数据预处理、序列发现和序列分析三个阶段。数据预处理是对源数据进行处理使之满足挖掘算法需要的数据格式;序列发现分为顺序序列挖掘和序列模式挖掘两个方面,主要是利用序列挖掘算法挖掘用户的访问序列;序列分析即对挖掘结果进行分析,从中发现有意义的知识。论文首先对数据预处理阶段采用的技术进行了分析研究,改进了针对访问序列挖掘的数据预处理方法;然后在序列模式挖掘部分对挖掘效率较高的GSP算法进行了研究和实现,并对算法进行了测试,对挖掘出的模式进行了分析;最后实现了一个完整的利用数据仓库平台挖掘Web用户访问顺序序列的方案,并采用真实商务站点日志对方案进行了验

3、证,对挖掘结果进行了分析,同时也将挖掘出的模式与GSP算法挖掘出的模式进行了比较。关键词:Web使用挖掘;Web日志;数据预处理;序列模式;访问序列;日志数据仓库AbstractUseraccesssequenceminingisallimportantresearchdirectionofWebusagemining,whichaimsatdiscoveringtheusers’visitinginterestandintentionofWebsitesbyminingWeblog.Withminingresults,websiteoperatorscanprovideuse

4、rswithpersonalizedrecommendationsandsitenavigationservices.Ifthefrequentlyaccesspathsareobtained,thereasonableadvertisementarrangementCallbemadetoimprovesiteadvertisingrevenue.Sitedeveloperscanusetheminingresultstoimprovesitesystemorstructureinordertoenhancetheefficiencyofsitevisits.Inaword,

5、accesssequencemininghasaverygoodprospectinvariousWebsiteapplications,particularlye-commercesitesandportalsites.Accesssequenceminingincludesthreestages:datapreprocesslng,sequencesdiscoveryandsequencesanalysis.Thepurposeofdatapreprocessingistoprocesssourcedata,andthepreprocessingresultscanmeet

6、therequirementsofminingalgorithms.Sequencesdiscoveryismininguser’saccesssequenceusingsequentialminingalgorithms,whichiSdividedintotwoaspects:ordinaIsequencesmmmgandsequencespatternsmining.Thetaskofsequencesanalysisstageisfindingmeaningfulknowledgefromtheminingresults.Inthethesis,techniquesus

7、edindatapreprocessinghavebeenresearchedatfirst,andapreprocessingprocedureforaccesssequenceminingwasimproved.Theninthesequentialpatternminingpart,ahigh—efficientsequentialpatternminingalgorithmnamedGSPwasresearchedandimplemented,algorithmperformance

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。