欢迎来到天天文库
浏览记录
ID:32986777
大小:1.89 MB
页数:61页
时间:2019-02-18
《基于web日志的数据挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、重庆大学硕士学位论文基于Web日志的数据挖掘研究姓名:付国瑜申请学位级别:硕士专业:计算机技术指导教师:郭平;黄贤英20070326重庆大学硕士学位论文中文摘要摘要随着Interne!t的不断发展,数据挖掘技术的研究和应用也越来越成为热点问题,在国际国内的学术界和信息产业界备受瞩目。如何把数据挖掘技术应用于Web,从Web服务器的日志中发掘有用的、重要的知识(包括模式、规则等),成为数据挖掘与知识发现的一个重要研究和应用领域,这就是基于Web日志的数据挖掘。文章首先对数据挖掘作了概括性的阐述,诸如数据挖掘的定义、功能、分类
2、等。接着对数据挖掘的一个重要分支一w曲日志挖掘进行了系统的研究。作者围绕对Web挖掘的流程这一线索,尤其是对预处理和模式发现这两个阶段展开了详细深入的探讨。针对数据预处理阶段的几个步骤,如数据清洗、用户识别、会话识别、路径补充等进行了重点的探讨,并给出了其具体实现算法。最后,针对Web挖掘的应用领域之一,作者对自适应的Web站点展开了较为详细的讨论,并提出了自适应站点的架构策略等系列问题。提出了一种适用于Web日志挖掘的数据结构一用户/页面(URL访问信息,并且利用基于该关联矩阵的用户聚类、页面聚类和频繁访问路径等算法,从
3、而实现用户和页面的聚类及用户的频繁访问路径。关键词:数据挖掘,Web日志,预处理,聚类,自适应重庆大学硕士学位论文英文摘要ABSTRACTDevelopcontinuouslyalongwitlltheIntemet,thedatascoopsouttechnicalreseardhandapplicationtoalsobecomealittlebithotproblemmoreandmore,isfocusedattentionfullyininternationallocalacademiccirclesandinf
4、ormationindustryfield.Howapplyadataexcavation'stechniqueinthe、)l,eb.theexhumationisusefulfromthedailyrecordofw曲server,importantknowledge(includemode,rule⋯etc.),becomeallimportanceresearchandapplicationrgahllofdataexcavationandknowledgedetection,thisisaccordingtoth
5、edataoftheW曲dailyrecordtoscoopout.Articlethelogarithmsmadetoelaborategenerallyaccordingtotheexcavationfirst,suchasthedefinition,functionofdataexcavation,classificationetc..Immediatelyafterthelogaritlmascarriedontheresearchofsystemaccordingtoanimportantdailyrecorde
6、xcavationofthebranch-Webofexcavation.TheprocessthattheauthorseircumambiancescoopsouttotheWebisthisclues,particularlyistoprepareprocessingandmodetodiscoverthesetwostageslauncheddetailedthoroughofstudy.Aimatafewstepsthatthedatapreparesaprocessingstage,ifthedataclean
7、s,thecustomeridentify,theconversationidenti助path'scomplement'setc.carriedonthestudyofpoint,andgiveitconcretelycarriesoutcalculateway.End,aimatoneoftheappliedrealmsofWebexcavation,authortofromorientationoftheWebstationorderedtolaunchtodiscussmoreandindetail,andputf
8、orwardorderingfromtheorientationstationofstructurestrategyetc.seriesproblem.Putforwardakindofconnectionmatrixofthedataslxucture.customer/page(URL_UserlD
此文档下载收益归作者所有