web用户访问聚类模式研究

web用户访问聚类模式研究

ID:33799971

大小:4.10 MB

页数:60页

时间:2019-03-01

web用户访问聚类模式研究_第1页
web用户访问聚类模式研究_第2页
web用户访问聚类模式研究_第3页
web用户访问聚类模式研究_第4页
web用户访问聚类模式研究_第5页
资源描述:

《web用户访问聚类模式研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、西安电子科技大学硕士学位论文Web用户访问聚类模式研究姓名:杜立平申请学位级别:硕士专业:计算机技术指导教师:刘志镜;赵耿20100408摘要摘要随着因特网的快速发展,海量的Web数据资源已经成为人们获取信息的重要来源。但是,由于Web资源所具有的一些特性,用户很难快速而准确地获取真正有价值的信息,由此产生了数据挖掘的概念。这种用于决策支持的新技术,能够利用已有的数据对未来的活动进行预测,并最终为用户提供方便的定制信息服务。现已成为一个新的重要的研究方向。本文系统、完整地论述了Web事务聚类分析的两个阶段,即数据预处理和

2、聚类分析阶段。其中数据预处理阶段又包括日志解析、数据清洗、用户识别和事务识别四个过程;同时,论文在此阶段引入了“概念URL”,以获得容易理解的聚类结果。在聚类分析阶段,本文结合蚁群优化的原理,建立了人工蚂蚁模型,并基于该模型实现了蚁群聚类分析算法。另外,本文还在聚类分析过程中使用了K均值算法,并比较了蚁群算法和K均值算法在Web事务聚类分析上的优劣。采用某学院Web服务器日志作为数据集的试验表明,本文的技术和方法能够获得质量良好的聚类结果。关键词:数据挖掘Web挖掘概念URLK均值蚁群算法AbstractAbstract

3、AlongwithInternet'srapiddevelopment,theenormousWebdataresourceshavealreadybecomeanimportantoriginforpeopletoobtaininformation.But,itisveryhardforuserstogainthetrueandvaluableinformationrapidlyandaccuratelyduetotheWebresources’traits,sotheconceptofdataminingispres

4、ented.Asanewtechnology,dataMiningisappliedtoDecisionSupportSystem,andevencanmakepredictionbasedonhistoricdata.Itcanfinallyprovidetheconvenientcustom-madeservicestotheusers.Nowithasalreadybecomeanewandimportantresearchdirection.Thispaperdiscussesthetwophases,which

5、aredatapreprocessingandclusteringanalysis,inWebtransactionsclusteringanalysisinasystematicandcompleteview.Thedatapreprocessingphasealsocontainstheproceduresoflogfileinterpretation,datawashing,useridentificationandtransactionidentification;atthesametime,inordertog

6、ainaneasilyinterpretedresult,thepaperintroducesthe“ConceptURL”inthisphase.Inclusteringphase,amodelofartificialantissetup.Basedonthismodel,thepaperimplementsanantcolonyclusteringalgorithm.What’smore,k-meansalgorithmisalsoimplementedinclusteringanalysisphase.Theres

7、ultiscomparedwiththatofantcolonyalgorithm.Experimentresultsarepresentedonweblogsofacertaincollegetoillustratethetechniquesandmethods.Thequalityofresultsisgood.Keyword:Data-miningWeb-miningConceptURLk-meansAntColonyAlgorithm西安电子科技大学学位论文独创性(或创新性)声明秉承学校严谨的学风和优良的科学道德

8、,本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。