欢迎来到天天文库
浏览记录
ID:56067287
大小:347.93 KB
页数:4页
时间:2020-06-20
《一种改进的基于粒子群的聚类算法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第31卷第9期计算机应用研究V01.31No.92014年9月ApplicationResearchofComputersSep.2014一种改进的基于粒子群的聚类算法水杨志,罗可(长沙理工大学计算机与通信工程学院,长沙410014)摘要:针对K—means对初始聚类中心敏感和易陷入局部最优的缺点,提出了一种改进的基于粒子群的聚类算法。该算法结合基于密度和最大最小距离法来确定初始聚类中心,解决K—means对初始值敏感的问题;利用粒子群算法全局寻优能力强的优点,避免K-means陷入局部最优。通过对样本集各维属性的规范化处理,惯性权值采用凹函数递减,计算相异度矩阵,引入用
2、群体适应度方差,进一步优化混合算法。实验结果表明,该算法具有更高的准确率和更强的收敛能力。关键词:聚类算法;粒子群优化算法;相异度矩阵;最大最小距离法;K-means;适应度方差中图分类号:TP311;TP301.6文献标志码:A文章编号:1001—3695(2014)09—2597—03doi:10.3969/j.issn.1001-3695.2014.09.008ImprovedclusteringalgorithmbasedonparticleswarmoptimizationYANGZhi,LUOKe(InstituteofComputer&Communicati
3、onEngineering,ChangshaUnive~iqofScience&Technology,Changsha410014,China)Abstract:ThispaperproposedanimprovedclusteringalgorithmbasedonparticleswarInoptimizationthatwasaimedtore—solvetheK—meansalgorithmshortcomingofsensitivingtotheinitialclusteringcenterandeasinesstofallintolocaloptimum.Th
4、eimprovedalgorithmcombineddensity—basedandmaximumminimumdistancemethodtodetermineinitialclusteringcenter,solvedproblemoftheK-meanswassensitivetotheinitialclusteringcenter.TheadvantagesofPSO’SstrongglobaloptimizationabilitywereusedtoavoidK—meansfallingintolocaloptimum.Bynormalizingeachattr
5、ibuteofthesampleset,inertiaweightwasdecreasedbyconcavefunction,calculatedthedissimilaritymatrixandintroducedparticleswarm’Sfitnessvariancetoopti—mizethehybridalgorithmfurther.Theexperimentalresultsshowthatthisalgorithmhashigheraccuracyandstrongerconver—gencecapability.Keywords:clusteringa
6、lgorithm;particleswarmoptimization;dissimilaritymatrix;max—mindistancemethod;K-means;fitt—nessVariance聚类是一种无监督学习,它广泛地应用在多个领域,包括对K.means算法进行优化,文献[6]利用粒子群全局寻优能力数据挖掘、模式识别、计算机视觉和生物信息学,是重要的数据强的特点改进K-means算法易陷入局部最优的缺点,但没有利分析方法之一。聚类是根据数据集中数据的相关性将其划分用好K.means算法的局部搜索能力强的特点。本文利用文献为若干簇的过程,目的是使同一簇内数据
7、点之间的相似性大,[7~9]的方法动态地自动确定聚类数和初始聚类中心,结合不同簇之间数据点相似性小。文献[10—12]的方法对样本集的规范化处理、调整粒子群权聚类算法中的划分和层次的方法是最流行的聚类技术。重、计算相异度矩阵和群体适应度方差进行优化,提出了一种基于划分的聚类算法主要是K—means及其优化算法;基于层次改进的基于粒子群的聚类算法,取得了较好的聚类效果。的聚类算法有UPGMA及改进算法。1967年,由MacQueen提1预备知识出的基于目标函数的K-means算法是一种有代表性的划分方法,具有简单、快速、有效处理
此文档下载收益归作者所有