基于粒子群优化的数据流挖掘的聚类算法分析

基于粒子群优化的数据流挖掘的聚类算法分析

ID:32967959

大小:2.81 MB

页数:56页

时间:2019-02-18

基于粒子群优化的数据流挖掘的聚类算法分析_第1页
基于粒子群优化的数据流挖掘的聚类算法分析_第2页
基于粒子群优化的数据流挖掘的聚类算法分析_第3页
基于粒子群优化的数据流挖掘的聚类算法分析_第4页
基于粒子群优化的数据流挖掘的聚类算法分析_第5页
资源描述:

《基于粒子群优化的数据流挖掘的聚类算法分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、长沙理工大学硕士学位论文基于粒子群优化的数据流挖掘的聚类算法分析姓名:王琳申请学位级别:硕士专业:计算机应用技术指导教师:罗可20100401摘要随着计算机及其应用技术的迅猛发展,人类获取数据的能力得到很大程度的提高,数据流(DataStreams)己成为重要的数据来源之一,因此有关数据流的挖掘算法也已成为一个重要的前沿课题。数据流聚类是数据流挖掘的一个重要的分支,其主要目的是从数据流中发现新的知识模式和隐藏的新规律。数据流是一个由不断到达的数据所组成的动态变化增长的数据集,要从有限的数据处理分析过渡到无限的数据处理分析,人们面临着新的严峻的

2、挑战,需要寻求新的聚类算法。最为经典的数据流聚类算法是CluStream算法,Clustream算法包括在线聚类部分和离线部分两部分,本文主要的研究工作是基于两层模型,对数据流的离线部分做优化处理。本文的主要研究工作包括以下几个方面:(1)分析了粒子群算法与遗传算法优缺点,并结合两者的优点,对基于质心的K.means算法的聚类中心做优化,使得K.means的聚类算法产生更好的聚类效果。实验数据表明:采用基于交换技术的混合IGA&PSO的聚类算法比单一的K.means算法性能更好。(2)PSO作为一种智能优化算法,有时也会因为早熟而陷入局部最优

3、解。为了解决局部最优的问题,利用捕食.被捕食的粒子群优化(PPPSO)作优化,在PPPSO中,捕食者追逐被捕食者的中心,而被捕食者逃离捕食者,这是一种防止局部最优者出现且找到全局最优者的一种有效的方法。本文提出了一种使用PPPSO来优化模糊均值的聚类方法。(3)在高维数据流空间罩,为了解决多余特征对数据流聚类质量的影响,提出了一种基于粒子群与特征选择的数据流聚类算法。此算法具有自动探测、移除多余不重要特征等功能。实验结果表示,基于特征选择的数据流聚类算法(DSCFC),在对有多余特征的数据流聚类时,比CluSteam算法更有效,聚类质量更好。

4、(4)在数据流挖掘中,要快速地挖掘出数据流中的任意有趣模式,如果只利用现有的基于频繁项集算法直接进行复杂模式挖掘是困难的。为解决此问题,一种基于频繁项集的条件模式挖掘被提出。从频繁项集出发,去挖掘那些不能从项集中立即发现的任意模式,即条件模式挖掘。把任意模式条件挖掘与数据聚类分析结合起来,能更快速有效地挖掘数据库中任意的有趣的规则。关键词:数据流挖掘;聚类分析;粒子群优化;捕食一被捕食;条件模式ABSTRACTWiththerapiddevelopmentofcomputeranditsapplicationtechnology,people

5、’SabilityofgettingdataincreasedtosuchalargeextentandDataStreamshasbecomeoneofimportantdatasource,thatthedatastreamminingalgorithmshavebecomeanimportantcutting—edgetopics.Clusteringdatastreamsisanimportantbranchofdatastreammining,itsmainpurposeofistodiscoverythenewknowledgem

6、odelandhiddennewrules.Datastreamisadynamicgrowingdataset,wlrichconsistsofcontinuousarrivingdata.Fromalimiteddataprocessingandanalysistoanunlimited,peoplearefacedwithnewchallengesandneedtofindanewclusteringalgorithm.TheCluStreamisthemostclassicdatastreamclusteringalgorithm,C

7、lustreamclusteringalgorithmincludesonlineandoffiinetwoparts,andinthisarticlethemainworkisdooffiineOptimizationtothedatastreambasedonthismodel.Themajorworkofthispaperwasshowasfollowing:(1)Theadvantagesanddisadvantagesofparticleswarmalgorithmandgeneticalgorithmareanalyzedandc

8、ombinedwiththeadvantagesofbothtoOptimizethecentroid—basedK—meansclustering,makingt

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。