欢迎来到天天文库
浏览记录
ID:35191037
大小:1.65 MB
页数:35页
时间:2019-03-21
《试析基于web日志的用户访问序列模式研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、东北师范大学硕士学位论文基于Web日志的用户访问序列模式研究姓名:左丹申请学位级别:硕士专业:计算机应用技术指导教师:姜华20090501摘要随着Internet的迅速发展,网络已经成为人们进行信息交流和信息处理的有效平台,它存储着海量的数据。由于庞大的信息量,对于每个用户来说,如何能够及时地发现有用的信息则变得越来越困难。为了解决上述问题,将数据挖掘技术应用于互联网,构成了一个新研究领域一卅eb挖掘(WebMining)。Web挖掘通常分为三类,Web使用挖掘是重要的应用研究方向之一,其目的是找出网站用户的访问模式,对优化站点结构和为用户提供个性化服
2、务具有重要的意义。本文主要研究了基于Web曰志的用户访问序列模式挖掘,为了避免用户访问序列挖掘过程中产生巨大的候选模式,提出了一种新的用户访问序列模式挖掘算法UAP-miner(UserAccessPatternmining)。该算法简化了挖掘过程中支持度的计算和候选模式的生成操作。首先使用UAP-tree(useraccesspatterntree)来记录用户访问序列和它的计数,避免冗长的支持度计算。构造出UAP—tree后,所有剩下的挖掘工作都在UAP-tree上进行,只需要扫描UAP-tree相关的子树,不再需要访问原始的用户访问序列数据库。然后
3、提出一个高效的算法,根据用户当前的访问序列从UAP-tree中发现频繁用户访问模式,该算法在挖掘过程中不会产生任何候选模式,所以具有较好的执行效率。最后结合具体的实例,对算法进行了验证。关键词:Web挖掘;Web使用挖掘;用户访问序列模式AstheIntemetgrows,communicateandmanage.information,ithasbecomeeveryuseLAbstractWebbecameaneffectiveplatformonwhichpeopleAmassofdataisstoredinit.Becauseofenormou
4、smoreandmoredifficulttodiscoverusefulinformationtOInordertosolvethatproblem,applicationofdataminingtechniquestoInternet,Webminingemerges.Webusagesminingisoneofthemostimportantresearchdirectionsinthewebminingresearchfield.Theaimofitistofindoutusertraversalpatternsofwebsites.Itwil
5、lhelpUStOimprovethesite’SstructureandprovidethebetterservicetotheUSers.Thispaperresearcheshowtominetheusertraversalpatternsbasedonweblog.Toavoidthehugeofcandidatepatternsduringuseraccesspatternmining,wepresentanewalgorithmUAP。miner(UserAccessPatternmining)foruseraccesspatternmin
6、ing.Thealgorithmfacilitatesthetedioussupportcountingandcandidategeneratingoperationsintheminingprocedure.UAP·tree(useraccesspatterntree)isusedtoregisteruseraCCeSSsequenceandcorrespondingcounts,SOthatthetedioussupportcountingcanbeavoided.OncetheUAP-treeisbuilt,alltheremainingmini
7、ngprocessingisbasedontheUAP.tree.Theoriginalaccessdatabaseisnotneededanymore;allefficientrecursivealgorithmisproposedtofinduseraCCeSSpatternfromUAP.tree.Nocandidategenerationisrequiredintheminingprocedure.Intheend,·thealgorithmistovalidateusingthetrialdata.Keywords:Webmining;Web
8、usagemining;useraccesssequencepatternU独创性声明本人声明
此文档下载收益归作者所有