欢迎来到天天文库
浏览记录
ID:36564044
大小:3.46 MB
页数:62页
时间:2019-05-12
《Web使用挖掘方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、华东理工大学硕士学位论文第I页Web使用挖掘方法研究摘要、随着Internet的普及和www的迅猛发展,用户对Web访问的信息己经成为世界上最矢的信息仓库之一。而信息的爆炸式增长与人们注意力的有限性之间的矛盾也随之加剧Web使用挖掘正是解决这一矛盾的有效手段,它从用户对Web的访问信息中抽取出感兴趣的模式,以发现用户访问站点的浏览模式,为站点管理员提供各种利于Web站点改进或可以带来经济效益的信息,从而对网站运营管理、开展电子商务和吸引用户都有深远的意义本文爵概述了数据挖掘的基本原理;接着对,e。挖掘的基本概念、分类和研究内容
2、进行概述,然后重点讨论了Web使用挖掘的过程、任务和研究现状。并在此基础上,明确了Web使用挖掘的研究难点在于:如何对原始日志数据进行预处理;如何设计有效的挖掘算法和模型来得到有价值的用户访问模式。在数据预处理方面,本文设计实现了一个Web使用数据挖掘预处理工具一一WUMPA,同时还提出了一个新的会话管理算法;在模式挖掘方面,为更好地了解用户的浏览模式,本文针对Web用户的访问特点,提出了一个基于垂直数据格式的频繁路径挖掘算法VFP,并用实验证明了其有效性。同时,针对Web使用挖掘中现有聚类模型的不足,提出了一个新的聚类模型—
3、频繁路径特征模型(简称FPFM模型),从而提高了会话聚类的有效性。关Mil:Web使用挖掘频繁路径特征模型厂预处理人第n页华东理工大学硕士学位论文ResearchesonWebUsageMiningAbstractWiththepopularityofInternetandtheexplosionofWWWWebusageinformationisbecomingthelargestinformationwarehouse.Asaresult,theconflictbetweenthelimitedhumanattention
4、andtheunlimitedinformationisbecomingmoreandmoreserious.Luckily,WebUsageMiningisfoundtobeanefectivemethodtosolvethisproblem.Itcanbeusedtofindoutusers'normalbrowsingpaternsandgivesignificantadvisesforwebsitesupervisorsbyextractsinterestingpaternsfromtheoriginalWebusag
5、einformation.Bythismeans,WebUsageMiningissignificantforWebsitedesignandmanagement,businessandmarketingdecisionsupportandusersattraction.Firstofall,thedissertationintroducestheWebMiningconceptsandcategoriesafterabriefoverviewofDataMiningtheory.Thenitfocusedontheintro
6、ductionofthetask,procedureandstudystatusofWebUsageMining.Basedonthesestudies,thedissertationsummarizesthatthekeyproblemsinvolvedinWebUsageMiningareasfollowed:howtopreprocesstherawweblogtoprovideanaccuratepictureofhowasiteisbeingused,andhowtodesignefficientDataMining
7、algorithmsandmodelstoextractusefulusers'browsingrulesandpaterns.Duringthedatapreprocessingphase,aWebUsageMiningpreprocessingtools-WUMPA,isdesignedandputintoefect.Alsoanewsessionmanagingalgorithmisintroducedinthisphase.Asforpatternsmining,aneficientVFPalgorithmisputf
8、orwardandverifiedforusers'frequentbrowsingpathanalysis.Atthesametime,thedissertationpresentsanewclusteringmodel-FPFMmodeltomakeupforthesho
此文档下载收益归作者所有