资源描述:
《一种基于投票策略的聚类融合算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第25卷 第3期计 算 机 仿 真2008年3月 文章编号:1006-9348(2008)03-0126-03一种基于投票策略的聚类融合算法李金磊1,朱晓莲2,朱海燕2(1.中国石化勘探南方分公司研究院,四川成都610041;2.中国地质大学(武汉)计算机学院,湖北武汉430074)摘要:在分类算法和回归模型中,融合方法正得到越来越广泛的应用,但在非监督机器学习领域,由于缺乏数据集的先验知识,则不能直接用于聚类算法。提出并实现了一种基于投票策略的聚类融合算法,该算法利用k-means算法每次随机选取聚类中心而得到不同样本划分的特性,将多次运行得到的聚类结果通过投票的方式合并,从而得到最终
2、的结果。通过一系列真实数据和合成数据集的实验证明,这种方法比单一的聚类算法能更有效地提高聚类的准确率。在此基础上,为了降低高维数据运算的复杂性,将随机划分属性子空间的方法应用到上述聚类融合算法中,实验证明,该方法同时也能够在一个属性子空间上获得好的聚类结果。关键词:聚类融合;均值算法;投票策略;属性子空间中图分类号:TP18 文献标识码:AAClusteringEnsemblesAlgorithmBasedonVotingStrategyLIJin-lei1,ZHUXiao-lian2,ZHUHai-yan2(1.ResearchInstituteofExplorationSouther
3、nDivisionCompany,SINOPEC,ChengdouSichuan610041,China;2.SchoolofComputer,ChinaUniversityofGeosciences,WuhanHubei430074,China)ABSTRACT:Intheclassificationandregressionalgorithms,theensemblemethodwaswidelyused,butintheunsu2pervisedlearning,itdidn’tbeusedintheclusteringalgorithmdirectlyduetolackofprio
4、rknowledge.Thispaperproposedaclusteringensemblesalgorithmbasedonvotingstrategy,itusedthecharacteristicthatthek-meansalgo2rithmselectedtheclusteringcentersrandomlyandfoundthedifferentpartitionsofthesample.Then,itcombinedtheclusteringresultsofoperatingthek-meansalgorithmrepeatedlytoafinalresultviath
5、evotingstrategy.Throughtheexperimentonlotsofrealdataandartificialdata,thismethodcouldreceiveabetterresultthanthesingleclusteringalgorithm.Moreover,toresolvethecomplexityofthehighdimensiondata,amethodforpartitioningthefeaturespacerandomlyintheensemblealgorithmwasused.Itprovedthatthismethodisabletor
6、eceiveagoodclusteringresultintheattributesubspacebytheexperiment.KEYWORDS:Clusteringensembles;Meansalgorithm;Votingstrategy;Attributesubspace1 引言的一系列研究和实验表明,聚类融合方法能得到比单一算法更为优越的结果,能够很好地提高聚类算法的鲁棒性和稳定聚类算法在数值分析、数据挖掘和模式识别领域有着非常广泛的应用,它们通过将数据样本划分成不同的类别来发性,并且能够实行并行计算。现和确定数据的结构分布[1]。文献[2]中介绍了大量的聚类本文结合聚类融合的
7、概念,提出了一种基于投票策略的聚类融合算法,该算法不仅计算量较少,而且聚类效果好。
算法,但在现实中还没有一个单一的算法能够识别出任意形[3]。受到在传感器融合和分类器融合方在此基础上,为了降低高维数据运算的复杂性,论文尝试采态的数据结构分布面的成果的启发[4],Fred和Jain提出了一系列基于Co-as2用随机划分属性子空间的方法,在不影响聚类效果的同时更sociation关系矩阵的聚类融合方法[1,5-6]。随后,