欢迎来到天天文库
浏览记录
ID:56223810
大小:225.50 KB
页数:48页
时间:2020-03-22
《模式识别中聚类分析算法综述(论文).doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、毕业设计(论文)模式识别中聚类分析算法综述院另I]专业名称信息与计算科学班级学号学生姓名指导教师2013年06月10日模式识别中聚类分析算法综述摘要聚类分析是将数据分类到不同的类或者簇的过程,聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给岀一个分类的标准,聚类分析能够从样本数据岀发,自动进行分类。从实际应用的角度看,聚类分析是数据挖掘的主要任务Z-O而且聚类能够作为一个独立的工具获得数据的分布状况,观察每一簇数据的特征,集中对特定的聚簇集合作进一步地分析。聚类分析还可以作为其他算法(如分类
2、和定性归纳算法)的预处理步骤。本文对模式识别中聚类分析算法进行了综述,主耍论述了顺序算法、层次算法和基于代价函数最优的聚类算法,其中层次算法分为合并算法和分裂算法,其中合并算法乂包括最短距离法、最长距离法、屮间距离法、重心法、类平均距离法;而基于代价函数最优的聚类算法则分为K均值算法和迭代自组织的数据分析算法。本文首先介绍了聚类算法的应用范围及具意义,并对聚类算法的基本分类进行了简单介绍,同吋对可能聚类的数量进行了阐述。Z后,详细介绍了上述各类算法的算法思想及其具体的实现步骤,并在顺序算法一章中给出了
3、BSAS算法的改进,并运用MATLAB对层次算法和基于代价函数最优的聚类算法中的儿个具体算法进行了代码实现,通过对样品图片的识别分类认识了聚类算法的具体应用,并且认识到了儿类算法齐自的特点。其中,层次算法中的五个算法实现步骤较为简单,但在其实现过程中需要输入一个合适的阈值,阈值的大小直接影响最后的结果,而且相同的阈值,不同的算法可能得到不同的结果。而K均值算法的实现结果则与阈值无关,只需定义迭代次数和类中心个数。与Z相比,ISODATA算法则具有自组织性,会在计算过程中不断调整类中心的个数。关键词:聚
4、类分析,顺序算法,层次算法,基于代价函数最优的聚类算法TheOverviewofPatternRecognitionClusteringAlgorithmAuthor:WhuenkmnknTutor:CnunnknhcljujAbstractClusteranalysisisadataclassificationintodifferentclassesorclustersintheprocess,Clusteranalysisisanexploratoryanalysis,intheclassific
5、ationprocess,peopledonotgiveaclassificationcriterioninadvance,clusteranalysistothedatafromthesamplestarting,automaticclassification.Fromapracticalperspective,Clusteranalysisisoneofthemaintasksofdatamining.Moreoverclusteringcanbeusedasaseparatetooltoobta
6、inthedistributionofthedata,observecharacteristicsofthedataineachclusterandmakeafurtheranalysisonparticularclusteredsets.Clusteranalysiscanalsobeusedasotheralgorithms'(suchasclassificationandqualitativeinductionalgorithm)preprocessingstep.Inthispaper,clu
7、steringalgorithmsinpatternrecognitionarereviewed,mainlydiscussingthesequentialalgorithm,hierarchicalalgorithmsandclusteringalgorithmbasedoncostfunctionoptimization.Hierarchicalalgorithmisdividedintodivisionalgorithmandmergingalgorithm,whichalsoincludest
8、heshortestdistancealgorithm,thelongestdistancealgorithm,themiddledistancealgorithm,centerofgravityalgorithm,theclassaveragedistancealgorithm;whiletheclusteringalgorithmbasedoncostfunctionoptimizationisdividedintoK-meansalgorithma
此文档下载收益归作者所有