欢迎来到天天文库
浏览记录
ID:33714163
大小:3.11 MB
页数:53页
时间:2019-02-28
《基于aco和pso相结合的web用户会话聚类方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、合肥工业大学硕士学位论文基于ACO和PSO相结合的Web用户会话聚类方法研究姓名:曹荣涛申请学位级别:硕士专业:管理科学与工程指导教师:凌海峰201204基于ACO和PSO相结合的Web用户会话聚类方法研究摘要随着Web2.0时代的到来,Web使用挖掘受到越来越多的关注。大规模的互联网用户访问行为产生了海量的数据。从用户使用行为中发掘出用户感兴趣的模式给研究人员也带来了挑战。找到这些模式是web使用挖掘最终的目标,它可以帮助改善站点的内容、结构和个性化服务,从而给用户带来更好的浏览体验。会话聚类是一种重要的Web使用挖掘技术,旨在发现相似的用户行为,这是目前Web使用挖掘
2、中的热点问题之一。该问题的难度在于要对大规模的会话进行聚类,这些会话被表示成高维向量,加大了对算法高效性的要求。群体智能算法由于其具有的高性能和易实现性,被众多学者应用到函数优化和工程技术领域,取得了较理想的效果,例如蚁群优化算法(AntColonyOptimization,ACO)和粒子群算法(ParticleSwarmOptimization,PS0)。而对运用群体智能算法进行web使用挖掘的研究尚处于起步阶段,算法本身在解决此类问题上还存在着不足之处。因此针对问题的特性如何进行算法的改进使其获得更好的性能具有重要的意义。本文主要的研究工作包括如下三个个方面的内容:(
3、1)从理论上对蚁群算法和粒子群算法进行分析,根据这两种算法各自存在的优点和缺陷,将两算法进行融合。(2)对UCI数据集进行聚类操作,验证混合算法的有效性。(3)运用混合算法进行真实Web用户会话进行聚类。实验结果表明该算法与ACO算法、PSO算法、K.Means算法相比,具有更好的性能。关键词:蚁群算法;粒子群算法;会话聚类;电子商务ResearchontheMethodofWebUserSessionClusteringBasedontheIntegrationofACOandPSOABSTRACTWiththearrivalofWeb2.0,Webuseminingh
4、asbeenpaidmoreattentionto.Amassofdataisproducedbylarge-scaleoftheintemetusers’accessingbehavior.Itisachallengeforresearcherstomineinterestingpatternsfromtheusageofwebusers.Findingthesepatternsisthefinalgoalofwebusagemining,itmayhelptoimprovethecontent,structure,andpersonalizedserviceofawe
5、bsite,SOastogiveusersbetterexperience.Sessionclusteringisanimportanttechnologywebusagemining,aimingtofindsimilaruserbehavior,whichisoneofthehotfieldinwebusagemining.Thedifficultyoftheproblemliesinthelargescalesessiondata,whichneedstoberepresentedasthehiglldimensionalvector,andwhichisachal
6、lengetotheperformanceofthealgorithm.Swarmintelligencealgorithmisappliedtofunctionoptimizationandengineeringtechnologybymanyscholars,forithashighperformanceandiseasytoimplement,andobtainedidealeffect,suchasAntColonyOptimizationalgorithm(AntColonyOptimization,ACO)andParticleSwarmalgorithm(P
7、articleSwarmOptimization,PSO).However,researchonwebusageminingbasedonswarmintelligencealgorithmisstillatthebeginning,thealgorithmhassomeshortcomingstotheproblemsonitself.Therefore,ithasgreatsignificancetoimprovethealgorithmaccordingtothecharacteristicsoftheseproblem
此文档下载收益归作者所有