欢迎来到天天文库
浏览记录
ID:36463247
大小:1.86 MB
页数:63页
时间:2019-05-10
《Web日志中序列模式挖掘及其应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、南京工业大学硕士学位论文Web日志中序列模式挖掘及其应用姓名:杨清莲申请学位级别:硕士专业:计算机应用技术指导教师:周庆敏20050101顿上学位论j[摘要随着Internet的迅速发展和不断的普及,web日志资源越来越丰富,如何分析和利用这些海量的数据是当前突出的问题。Web日志挖掘是网络信息处理的一门新技术,也是数据挖掘在Intemet领域的一个重要应用。伴随着Intemet的迅速发展,Web同志挖掘在电子商务和个性化Web等方面有着广泛的应用。通过挖掘Web日志可以改善网站的组织结构,监控服务器的工作情况,改善Web应用的系统设计,
2、为用户提供个性化服务。另外,Web目志挖掘中通过分析挖掘用户访问路径的结果可以改善站点的设计,改进市场决策。Web日志挖掘就是运用数据挖掘的思想来对服务器目志进行分析处理,因而可以实现上述的各种功能。但目前现有的用户访问路径挖掘算法大多数只是直接利用挖掘布尔关联规则频繁项集的Apriori算法,而没有很好的考虑如何结合访问路径的特点来改进算法.以得到更好的挖掘结果及挖掘效率。本文在研究数据挖掘技术的基础上,重点研究了Web日志挖掘的特点、方法及相关技术。讨论了日志预处理的过程及几种有效的数据预处理方法,实现了分割服务器日志为单独的用户和用
3、户会话过程。关联规则和序列模式是研究和发现事务数据库中数据项之间的相关性的方法。本文深入研究了关联规则挖掘技术和序列模式识别技术,并结合二者的优点,实现了基于关联规则的序列模式识别算法。算法可以从Web服务器日志中挖掘出用户信息和数据信息,有效地识别用户访问模式。并将Web日志挖掘技术应用于电子商务领域,介绍了几种应用方向,重点研究了改进站点设计的方法。实验证明,web日志挖掘技术可以有效的识别用户访问模式,为网站管理员和商家决策提供宝贵的信息,实现网络个性化服务。关键字:数据挖掘Web日志关联规则序列模式电子商务——垒堕!坠盟ABSTR
4、ACTWiththerapiddevelopmentandapplicationofInternet,theresourceofW曲logisbecomingmoreandmoreabundant.Theprominentproblemishowtoanalyzeandusethegreatamountofdata.TheWeblogminingisanewtechniqueofWebinformationprocessing,anditisalsoanimportantapplicationofdataminingintheInteme
5、tdomain.WiththerapiddevelopmentofInternet,weblogminingiswidelyappliedtoE-commerceandindividuafingWeb.WeoanimprovethestructuresofWebsitesandthesystemdesignofWebapplication,monitortheserverandprovideindividualservicetotheusers.Inaddition,Weblogminingcouldoptimizethedesignof
6、theWebsitesandimprovesthedecision-makingofthemarketbyanalyzingaccesspathoftheuserswhousetheWebmining.WeblogminingistOusetheideaofdataminingtoanalyzeanddealwiththeserverlogs,thuswecanHsethesetechniquestorealizetheabovefunctions.However,thealgorithmsofmininguser’Svisitingpa
7、thsusedpresentlyaremostlytousetheApriorialgorithmwhichminesdirectlyfrequentitemsetofBooleanassociationrule.Itignoreshowtocombinewiththefeaturesoftheaccesspathtoimprovethealgorithms,whichCangetbeaerminingresultsandmakeminingmoreefficient,Basedontheresearchofdataminingtechn
8、ique,wefocusonthefeature,methodandrelatedtechniquesofWeblogmining.Theprocessofthelogprocessingan
此文档下载收益归作者所有