试析基于web日志的用户访问序列模式研究

试析基于web日志的用户访问序列模式研究

ID:35191037

大小:1.65 MB

页数:35页

时间:2019-03-21

试析基于web日志的用户访问序列模式研究_第1页
试析基于web日志的用户访问序列模式研究_第2页
试析基于web日志的用户访问序列模式研究_第3页
试析基于web日志的用户访问序列模式研究_第4页
试析基于web日志的用户访问序列模式研究_第5页
资源描述:

《试析基于web日志的用户访问序列模式研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、东北师范大学硕士学位论文基于Web日志的用户访问序列模式研究姓名:左丹申请学位级别:硕士专业:计算机应用技术指导教师:姜华20090501摘要随着Internet的迅速发展,网络已经成为人们进行信息交流和信息处理的有效平台,它存储着海量的数据。由于庞大的信息量,对于每个用户来说,如何能够及时地发现有用的信息则变得越来越困难。为了解决上述问题,将数据挖掘技术应用于互联网,构成了一个新研究领域一卅eb挖掘(WebMining)。Web挖掘通常分为三类,Web使用挖掘是重要的应用研究方向之一,其目的是找出网站用户的访问模式,对优化站点结构和为用户提供个性化服

2、务具有重要的意义。本文主要研究了基于Web曰志的用户访问序列模式挖掘,为了避免用户访问序列挖掘过程中产生巨大的候选模式,提出了一种新的用户访问序列模式挖掘算法UAP-miner(UserAccessPatternmining)。该算法简化了挖掘过程中支持度的计算和候选模式的生成操作。首先使用UAP-tree(useraccesspatterntree)来记录用户访问序列和它的计数,避免冗长的支持度计算。构造出UAP—tree后,所有剩下的挖掘工作都在UAP-tree上进行,只需要扫描UAP-tree相关的子树,不再需要访问原始的用户访问序列数据库。然后

3、提出一个高效的算法,根据用户当前的访问序列从UAP-tree中发现频繁用户访问模式,该算法在挖掘过程中不会产生任何候选模式,所以具有较好的执行效率。最后结合具体的实例,对算法进行了验证。关键词:Web挖掘;Web使用挖掘;用户访问序列模式AstheIntemetgrows,communicateandmanage.information,ithasbecomeeveryuseLAbstractWebbecameaneffectiveplatformonwhichpeopleAmassofdataisstoredinit.Becauseofenormou

4、smoreandmoredifficulttodiscoverusefulinformationtOInordertosolvethatproblem,applicationofdataminingtechniquestoInternet,Webminingemerges.Webusagesminingisoneofthemostimportantresearchdirectionsinthewebminingresearchfield.Theaimofitistofindoutusertraversalpatternsofwebsites.Itwil

5、lhelpUStOimprovethesite’SstructureandprovidethebetterservicetotheUSers.Thispaperresearcheshowtominetheusertraversalpatternsbasedonweblog.Toavoidthehugeofcandidatepatternsduringuseraccesspatternmining,wepresentanewalgorithmUAP。miner(UserAccessPatternmining)foruseraccesspatternmin

6、ing.Thealgorithmfacilitatesthetedioussupportcountingandcandidategeneratingoperationsintheminingprocedure.UAP·tree(useraccesspatterntree)isusedtoregisteruseraCCeSSsequenceandcorrespondingcounts,SOthatthetedioussupportcountingcanbeavoided.OncetheUAP-treeisbuilt,alltheremainingmini

7、ngprocessingisbasedontheUAP.tree.Theoriginalaccessdatabaseisnotneededanymore;allefficientrecursivealgorithmisproposedtofinduseraCCeSSpatternfromUAP.tree.Nocandidategenerationisrequiredintheminingprocedure.Intheend,·thealgorithmistovalidateusingthetrialdata.Keywords:Webmining;Web

8、usagemining;useraccesssequencepatternU独创性声明本人声明

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。