模式识别中聚类分析算法综述(论文)

模式识别中聚类分析算法综述(论文)

ID:15335333

大小:929.50 KB

页数:45页

时间:2018-08-02

模式识别中聚类分析算法综述(论文)_第1页
模式识别中聚类分析算法综述(论文)_第2页
模式识别中聚类分析算法综述(论文)_第3页
模式识别中聚类分析算法综述(论文)_第4页
模式识别中聚类分析算法综述(论文)_第5页
资源描述:

《模式识别中聚类分析算法综述(论文)》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、毕业设计(论文)模式识别中聚类分析算法综述院别专业名称信息与计算科学班级学号学生姓名指导教师2013年06月10日模式识别中聚类分析算法综述摘要聚类分析是将数据分类到不同的类或者簇的过程,聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。从实际应用的角度看,聚类分析是数据挖掘的主要任务之一。而且聚类能够作为一个独立的工具获得数据的分布状况,观察每一簇数据的特征,集中对特定的聚簇集合作进一步地分析。聚类分析还可以作为其他算法(如分类和定性归纳算法)的预处理步骤。本文对模式

2、识别中聚类分析算法进行了综述,主要论述了顺序算法、层次算法和基于代价函数最优的聚类算法,其中层次算法分为合并算法和分裂算法,其中合并算法又包括最短距离法、最长距离法、中间距离法、重心法、类平均距离法;而基于代价函数最优的聚类算法则分为K均值算法和迭代自组织的数据分析算法。本文首先介绍了聚类算法的应用范围及其意义,并对聚类算法的基本分类进行了简单介绍,同时对可能聚类的数量进行了阐述。之后,详细介绍了上述各类算法的算法思想及其具体的实现步骤,并在顺序算法一章中给出了BSAS算法的改进,并运用MATLAB对层次算法和基于代价函数最优的聚类算法

3、中的几个具体算法进行了代码实现,通过对样品图片的识别分类认识了聚类算法的具体应用,并且认识到了几类算法各自的特点。其中,层次算法中的五个算法实现步骤较为简单,但在其实现过程中需要输入一个合适的阈值,阈值的大小直接影响最后的结果,而且相同的阈值,不同的算法可能得到不同的结果。而K均值算法的实现结果则与阈值无关,只需定义迭代次数和类中心个数。与之相比,ISODATA算法则具有自组织性,会在计算过程中不断调整类中心的个数。关键词:聚类分析,顺序算法,层次算法,基于代价函数最优的聚类算法TheOverviewofPatternRecogniti

4、onClusteringAlgorithmAuthor:WhuenkmnknTutor:CnunnknhcfjujAbstractClusteranalysisisadataclassificationintodifferentclassesorclustersintheprocess,Clusteranalysisisanexploratoryanalysis,intheclassificationprocess,peopledonotgiveaclassificationcriterioninadvance,clusteranaly

5、sistothedatafromthesamplestarting,automaticclassification.Fromapracticalperspective,Clusteranalysisisoneofthemaintasksofdatamining.Moreoverclusteringcanbeusedasaseparatetooltoobtainthedistributionofthedata,observecharacteristicsofthedataineachclusterandmakeafurtheranalys

6、isonparticularclusteredsets.Clusteranalysiscanalsobeusedasotheralgorithms’(suchasclassificationandqualitativeinductionalgorithm)preprocessingstep.Inthispaper,clusteringalgorithmsinpatternrecognitionarereviewed,mainlydiscussingthesequentialalgorithm,hierarchicalalgorithms

7、andclusteringalgorithmbasedoncostfunctionoptimization.Hierarchicalalgorithmisdividedintodivisionalgorithmandmergingalgorithm,whichalsoincludestheshortestdistancealgorithm,thelongestdistancealgorithm,themiddledistancealgorithm,centerofgravityalgorithm,theclassaveragedista

8、ncealgorithm;whiletheclusteringalgorithmbasedoncostfunctionoptimizationisdividedintoK-meansalgorithmand

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。