欢迎来到天天文库
浏览记录
ID:34167674
大小:5.92 MB
页数:91页
时间:2019-03-04
《web使用挖掘方法地研究与改进》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、Web使用挖掘方法的研究与改进摘要摘要随着数据挖掘技术的发展,人们尝试将该技术运用于Web,形成了Web挖掘技术,Web使用挖掘就是其中一个重要的分支。Web使用挖掘通过对Web日志的分析,获取Web上隐藏的用户感兴趣的信息,为用户提供个性化服务、信息导航,并对网站结构的改进与优化提供依据。Web使用挖掘分为数据采集、数据预处理、模式发现与模式分析四个阶段,其中数据预处理和模式发现是本文研究的重点。首先,数据预处理是Web使用挖掘的一个难点。它分为数据清洗、会话识别、路径补充、事务识别四个阶段。本文
2、在会话识别阶段,提出了基于DFA方式的会话识别。在路径补充阶段,提出了一种基于多窗口方式的路径补充。并在此基础上,构造了可用于动态框架网站会话识别的SRDFA。在事务识别阶段,本文改进了事务识别方法中的最大向前路径法,在事务识别阶段记录可能需要添加的超链接。其次,模式发现也是一个重要的阶段。在这个阶段中,本文给出了一种改进的Apriori算法(RSApriori算法)。它通过自上而下的方式从最大频繁项集开始挖掘,直到挖掘出用户需要的频繁项集后终止。此外,本文设计了两个验证性实验,证明了整个处理框架的
3、可行性。最后,本文将整个处理方法运用于一个真实的MVC模式下的struts框架网站,在实践中证明了此方法的有效性和实用性。本文对Web使用挖掘部分算法的改进具有一定的现实意义。首先,它对会话识别和事务分割方法的研究以及部分数据挖掘算法的改进具有一定的参考价值,在一定程度上推动了Web使用挖掘算法的研究;其次,它也促进了Web访问行为分析、网站结构分析和网站结构优化等方面的研究。关键字:W-eb使用挖掘、会话识别、路径补充、关联规则、Apriori算法作者:黄金晶导师:杨季文AbstractResea
4、rchandImprovementonWebUsageMiningResearchandImprovementonWebUsageMiningResearchersapplydataminingtechnologiestOresearchsonwebtechnologiessincedataminingtechnologiesarerapidlydeveloped.Itresultsinanewresearchareacalledwebmining.Webusagemining,whichretri
5、eveshiddenandinterestingimformationbyanlaysingwebserverlog,isoneoftheimportantbranchesofwebmining.Itprovidesindividuationandnavigationofwebsystemstousers.Moreover;itisthefoundationofreconstructingwebsites.Webusageminingisdividedintofourphases,datacolle
6、ction,datapreprocessing,establishinterestingmodelandpaRemanalysis,andtwoofthem,datapreprocessingandestablishinterestingmodel,arewhatthispaperfocuseson.Firstly,inwebusageminig,onedifficultyisdatapreprocessing,whichisdividedintodatacleaning,sessionrecons
7、truction,pathsupplementandtransactionreconstruction.Inthestepofsessionreconstruction,thispaperproposessessionreconstructionbasedonDFA,andinthepathsupplementstep,proposesapathsupplementmethodbasedonmulti·window.Besides,thepaperproposesSRDFA,whichreconst
8、ructssessionsaimingatdynamicframeworkwebsites.Inthetransactionreconstructionstep,thispaperimprovesthemaximalpathforwardmethod,whichrecordsthehyperlinkthatneedbeappended.Secondly,establishinterestingmodelisanimportantphase.Inthispaper,we
此文档下载收益归作者所有