模糊c-均值聚类分析的应用

模糊c-均值聚类分析的应用

ID:13376188

大小:305.50 KB

页数:23页

时间:2018-07-22

模糊c-均值聚类分析的应用_第1页
模糊c-均值聚类分析的应用_第2页
模糊c-均值聚类分析的应用_第3页
模糊c-均值聚类分析的应用_第4页
模糊c-均值聚类分析的应用_第5页
资源描述:

《模糊c-均值聚类分析的应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、模式识别作业模糊C-均值聚类分析的应用学院、系电子信息工程学院自动化系专业名称模式识别与智能系统年级学生姓名学号目录1.前言12.模糊C均值算法22.1FCM算法准则22.2模糊C均值算法步骤32.2.1简介32.2.2FCM算法具体步骤43.模糊C均值聚类算法的Matlab实现53.1实验数据53.2模糊C均值聚类程序分析73.3Matlab实现及结果分析73.3.1前29组数据的聚类分析73.3.249组数据的聚类分析15总结20参考文献21模糊C-均值聚类分析的应用1.前言聚类就是按照一定的要求和规律对事物进行区分和分类的过程,在这一过程中没有任何关于类分的先验知识

2、,仅靠事物间的相似性作为类属划分的准则,因此属于无监督分类的范畴。聚类分析则是指用数学的方法研究和处理给定对象的分类。“人以群分,物以类聚”,聚类是一个古老的问题,它伴随着人类社会的产生和发展而不断深化,人类要认识世界就必须区别不同的事物并认识事物间的相似性。传统的聚类分析是一种硬划分,它把每个待辨识的对象严格地划分到某个类中,同一事物属于且仅属于所划定类别中的某一类,具有非此即彼的性质。例如在描述人的很多特征之一——性别的时候,很容易就可以对人进行分类,因为性别只有男性和女性之分,因此这种分类的类别界限是分明的、清晰的、不含糊的,属于普通集合理论的范畴。而实际上大多数对

3、象并没有严格的属性,它们在形态和类属方面存在着中介性,适合进行软划分,用普通集合的理论往往不能完全解决具有模糊性的分类问题。例如:将人按身高分为:高个子、中等个子、矮个子;图1-1所示经典硬聚类无法解决的聚类问题示意图,I部分代表高个子,II部分代表矮个子,但是他们的交集部分,用传统的硬聚类分析方法就无法解决。图1-1经典硬聚类无法解决的聚类问题示意图在此基础上,Zadeh提出的模糊集理论为这种软划分提供了有力的分析工具,人们开始用模糊的方法来处理聚类问题,并称之为模糊聚类分析。应该指出,基于模糊集理论的模糊逻辑本身并不是模糊的,而是用来对“模糊”21进行处理以达到消除模

4、糊的逻辑。事实上,模糊逻辑是一种精确地解决不精确、不完全信息的方法,其最大的特点就是用它可以比较自然的处理人类的概念。具体地说,模糊逻辑是通过模糊集合来工作的,模糊集合与传统集合的本质区别在于:(1)传统集合对集合中的元素关系进行严格区分,一个元素要么属于此集合,要么不属于此集合,并且不存在介于二者之间的情况;(2)模糊集合则具有灵活的隶属关系,允许元素在一个集合中部分隶属。元素在模糊集合中的隶属度可以是从0到1之间的任何值,而不像在传统集合中要么是0要么是1,这样模糊集合可以从“不隶属”到“隶属”逐级的过渡。正是由于模糊聚类具有样本属于各个类别的不确定性程度,表达了样本

5、类属的中介性,即建立起了样本对于类别的不确定性的描述,能更客观地反映现实世界,从而成为聚类分析研究的主流。为了优化聚类分析的目标函数,人们提出了现在相当流行和应用广泛的模糊C-均值FCM(FuzzyC-means)聚类算法。该算法是从硬C-均值HCM(HardC-means)聚类算法发展而来的。2.模糊C均值算法2.1FCM算法准则给定数据集,其中每个元素包含s个属性。模糊聚类就是要将X划分为c个类,为C个类的聚类中心在模糊划分中,每一个样本点不能严格地被划分到某一类,而是以一定的隶属度属于某一类。令表示第j个样本点第i个类的隶属度。且满足下式:(2.1)(2.2)(2.

6、3)FCM算法的目标函数为:(2.4)21其中,为样本点与聚类中心之间的距离则FCM算法就是要求满足的情况下目标函数J的最小值,J的条件极值可以由拉格朗日乘数法求得。首先,J在(2.4)式下的条件极值可以表示成(2.5)式,其中函数为常数:(2.5)对求偏导经过计算后得:,用同样的方法为最小值时的值为:(i=1,2…c)2.2模糊C均值算法步骤2.2.1简介FCM算法有五个参数(,A,c,m,ε),改变任何一个参数都将影响到FCM聚类的最终结果。(1)为初始隶属度矩阵,它直接影响到聚类中心的初始值,隶属度可以看做是数据对聚类中心作用力强度的表征,隶属度越大,数据对类中心的

7、吸引力就越大,类中心的下一次迭代值受它的影响也就越大,从而影响到算法的迭代次数,也就影响了算法的计算时间。(2)对称矩阵A,对称矩阵A也是一个重要参数,当A=I时,聚类类似于球状分布,当聚类形状为球状时,可给A赋予不同的矩阵形式,以适应不同的聚类要求,例如,聚类近似于条状或带形分布时。(3)聚类数目c,21c是影响聚类精度和聚类速度的参数,若c较大,就会使原本密集的簇分开;若c值较小则会使原本是比较分离的簇合并,使聚类结果不能满足客户的需要,计算所需要的系统内存和时间也要成倍的增加,这有时候是不能容忍的。(4)加权指数m,Za

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。