资源描述:
《模糊聚类分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、模糊聚类分析(一)1聚类分析的基本概念“聚类”就是按照一定的要求和规律对事物进行区分和分类的过程,在这一过程中没有任何关于分类的先验知识,仅靠事物间的相似性作为类属划分的准则,属于无监督分类的范畴。“聚类分析”是指用数学的方法研究和处理给定对象的分类。“人以群分,物以类聚”,聚类是一个古老的问题,它伴随着人类社会的产生和发展而不断深化,人类要认识世界就必须区别不同的事物并认识事物间的相似性。聚类分析的基本概念聚类分析是多元统计分析的一种,它把一个没有类别标记的样本集按某种准则划分成若干个子集(类),使相似的样本尽可能归为一类,而不相似的样本
2、尽量划分到不同的类中。传统的聚类分析是一种硬划分,它把每个待辨识的对象严格地划分到某类中,具有非此即彼的性质,因此这种类别划分的界限是分明的。而实际上大多数对象并没有严格的属性,它们在性态和类属方面存在着中介性,具有亦此亦彼的性质,因此适合进行软划分。聚类分析的基本概念模糊集理论的提出为软划分提供了有力的分析工具,用模糊数学的方法来处理聚类问题,被称之为模糊聚类分析。由于模糊聚类得到了样本属于各个类别的不确定性程度,表达了样本类属的中介性,更能客观地反映现实世界,从而成为聚类分析研究的主流。模糊聚类已经在诸多领域获得了广泛的应用,如模式识别
3、、图像处理、信道均衡、矢量量化编码、神经网络的训练、参数估计、医学诊断、天气预报、食品分类、水质分析等。聚类分析的基本概念常用的模糊聚类分析方法大致可分为两大类:其一是基于模糊关系(矩阵)的聚类分析方法,而作为其中核心步骤的模糊分类,有下述的主要方法:模糊传递闭包法、直接聚类法、最大树法和编网法;其二是基于目标函数的聚类分析方法,称为模糊C均值(FCM)聚类算法(或称为模糊ISODATA聚类分析法)。本讲先介绍第一类方法,作为准备先讲解模糊关系传递闭包的基本概念。模糊关系的传递闭包设X,Y是非空经典集,X到Y的一个模糊(二元)关系R是指X
4、Y上的一个模糊集R:XY[0,1].X到X的模糊关系称为X上的模糊关系。设R是X上的模糊关系,即RF(XX).称R是自反的,如果R(x,x)=1,xX.称R是对称的,如果R(x,y)=R(y,x),x,yX.若R是X上的自反、对称的模糊关系,则称R是X上的模糊相似关系。模糊关系某家庭子女和父母外貌相像关系为R,父母和祖父母、外祖父母相像关系为S,它们分别用以下模糊矩阵确定,计算其max-min合成。父母子女祖父祖母外祖父外祖母父母模糊关系的传递闭包设RF(XX).称R是传递的,如果对任意[0,1]及任意x,y,zX
5、成立:R(x,y),R(y,z)R(x,z).若R是X上的自反、对称、传递的模糊关系,则称R是X上的模糊等价关系。设RF(XX).则(1)R是自反的IR,这里I是恒等关系,即当x=y时I(x,y)=1,当xy时I(x,y)=0.(2)R是对称的R=R1.(3)R是传递的R2R.模糊关系的传递闭包设RF(XX).则R是模糊等价关系当且仅当对任意[0,1],R是等价关系。论域X上的经典等价关系可以导出X的一个分类。论域X上的一个模糊等价关系R对应一族经典等价关系{R:[0,1]}.这说明模糊等价关
6、系给出X的一个分类的系列。这样,在实际应用问题中可以选择“某个水平”上的分类结果,这就是模糊聚类分析的理论基础。实际问题中建立的模糊关系常常不是等价关系而是相似关系,这就需要将模糊相似关系改造为模糊等价关系,传递闭包正是这样一种工具。模糊关系的传递闭包定义9.2.1设RF(XX).若R1F(XX)是传递的且满足:1)RR1,2)若S是X上的模糊传递关系且RS,必有R1S.则称R1为R的传递闭包,记为t(R).根据上述定义,模糊关系R的传递闭包是包含R的最小传递关系。定理9.2.2设RF(XX).则t(R)=∪n=1Rn.
7、证明:容易验证A,BiF(XX),A∪i=1Bi=∪i=1(ABi),(∪i=1Bi)A=∪i=1(BiA).据此可以证明∪n=1Rn是传递的:模糊关系的传递闭包计算有限论域上自反模糊关系R的传递闭包的方法:从R出发,反复自乘,依次计算出R2,R4,…,当第一次出现RkRk=Rk时得t(R)=Rk.模糊关系的传递闭包定理9.2.5设RF(XX).则R的传递闭包t(R)具有以下性质:(1)若IR,则It(R);(2)(t(R))1=t(R1);(3)若R=R1,则(t(R))1=t(R).上述结论表明
8、:自反关系的传递闭包是自反的,对称关系的传递闭包是对称的。于是,模糊相似关系的传递闭包是模糊等价关系。例设
9、X
10、=5,R是X上的模糊关系,R可表示为如下的5×5模糊矩阵。求R的传