一种基于投票策略的聚类融合算法

一种基于投票策略的聚类融合算法

ID:27727049

大小:551.00 KB

页数:7页

时间:2018-12-05

一种基于投票策略的聚类融合算法_第1页
一种基于投票策略的聚类融合算法_第2页
一种基于投票策略的聚类融合算法_第3页
一种基于投票策略的聚类融合算法_第4页
一种基于投票策略的聚类融合算法_第5页
资源描述:

《一种基于投票策略的聚类融合算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第25卷 第3期计 算 机 仿 真2008年3月  文章编号:1006-9348(2008)03-0126-03一种基于投票策略的聚类融合算法李金磊1,朱晓莲2,朱海燕2(1.中国石化勘探南方分公司研究院,四川成都610041;2.中国地质大学(武汉)计算机学院,湖北武汉430074)摘要:在分类算法和回归模型中,融合方法正得到越来越广泛的应用,但在非监督机器学习领域,由于缺乏数据集的先验知识,则不能直接用于聚类算法。提出并实现了一种基于投票策略的聚类融合算法,该算法利用k-means算法每次随机选取聚类中心而得到不同样本划分的特性,将多次运行得到的聚类结果通过投票的方式合并,从而得到最终

2、的结果。通过一系列真实数据和合成数据集的实验证明,这种方法比单一的聚类算法能更有效地提高聚类的准确率。在此基础上,为了降低高维数据运算的复杂性,将随机划分属性子空间的方法应用到上述聚类融合算法中,实验证明,该方法同时也能够在一个属性子空间上获得好的聚类结果。关键词:聚类融合;均值算法;投票策略;属性子空间中图分类号:TP18  文献标识码:AAClusteringEnsemblesAlgorithmBasedonVotingStrategyLIJin-lei1,ZHUXiao-lian2,ZHUHai-yan2(1.ResearchInstituteofExplorationSouther

3、nDivisionCompany,SINOPEC,ChengdouSichuan610041,China;2.SchoolofComputer,ChinaUniversityofGeosciences,WuhanHubei430074,China)ABSTRACT:Intheclassificationandregressionalgorithms,theensemblemethodwaswidelyused,butintheunsu2pervisedlearning,itdidn’tbeusedintheclusteringalgorithmdirectlyduetolackofprio

4、rknowledge.Thispaperproposedaclusteringensemblesalgorithmbasedonvotingstrategy,itusedthecharacteristicthatthek-meansalgo2rithmselectedtheclusteringcentersrandomlyandfoundthedifferentpartitionsofthesample.Then,itcombinedtheclusteringresultsofoperatingthek-meansalgorithmrepeatedlytoafinalresultviath

5、evotingstrategy.Throughtheexperimentonlotsofrealdataandartificialdata,thismethodcouldreceiveabetterresultthanthesingleclusteringalgorithm.Moreover,toresolvethecomplexityofthehighdimensiondata,amethodforpartitioningthefeaturespacerandomlyintheensemblealgorithmwasused.Itprovedthatthismethodisabletor

6、eceiveagoodclusteringresultintheattributesubspacebytheexperiment.KEYWORDS:Clusteringensembles;Meansalgorithm;Votingstrategy;Attributesubspace1 引言的一系列研究和实验表明,聚类融合方法能得到比单一算法更为优越的结果,能够很好地提高聚类算法的鲁棒性和稳定聚类算法在数值分析、数据挖掘和模式识别领域有着非常广泛的应用,它们通过将数据样本划分成不同的类别来发性,并且能够实行并行计算。现和确定数据的结构分布[1]。文献[2]中介绍了大量的聚类本文结合聚类融合的

7、概念,提出了一种基于投票策略的聚类融合算法,该算法不仅计算量较少,而且聚类效果好。 算法,但在现实中还没有一个单一的算法能够识别出任意形[3]。受到在传感器融合和分类器融合方在此基础上,为了降低高维数据运算的复杂性,论文尝试采态的数据结构分布面的成果的启发[4],Fred和Jain提出了一系列基于Co-as2用随机划分属性子空间的方法,在不影响聚类效果的同时更sociation关系矩阵的聚类融合方法[1,5-6]。随后,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。