资源描述:
《第七章模糊聚类分析课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、一、模糊聚类分析聚类分析:按照一定要求和原则对事物进行分类。聚类:普通分类——清晰事物模糊分类——带有模糊性的事物三种模糊聚类方法:传递闭包法——基于模糊等价关系;直接聚类法——基于模糊相似关系;模糊聚类法——基于模糊划分.二、模糊聚类分析的步骤1.选取特征指标特征要有明确的意义,要有较强的分辨力,有代表性,并确定描述特征的变量。分类事物的特征指标选择的如何,对分类结果有直接的影响。2.数据标准化(正规化)令其中,xi为原始数据;是原始数据的均值;是原始数据的标准差;是数据处理后的数据。3.标定设为待分类的对象,
2、uj有m个刻划其特征的数据,就是根据实际情况,按一个准则或某一种方法,给论域U中的元素两两之间都赋以区间[0,1]内的一个数,叫做相似系数。它的大小表征两个元素彼此接近或相似的程度。,然后对于ui与uj,用rij表示ui与uj的当rij=0时,表示ui与uj截然不同;当rij=1时,表示ui与uj可以等同(不能说是完全相同);rij可根据具体问题来选取。方法有:的相似程度,要求(1)数量积法,其中显然.如果rij中出现负值,可采用下面方法将全体rij进行重新调整.方法1令,则方法2令其中于是(2)夹角余弦法如果r
3、ij中出现负值,也可采用上面方法调整.(3)相关系数法其中(4)最大最小法(5)算术平均最小法(6)几何平均最小法(8)指数相似系数法其中sk适当选择.(9)绝对值倒数法M适当选取使rij在[0,1]中且分散开(7)绝对值指数法(11)非参数法中正数个数,中负数个数,令则(10)绝对值减数法(12)贴近度法如果特征则ui,uj可看作模糊向量,以它们的贴近度D(ui,uj)为其相似程度.i)格贴近度,其中ii)距离贴近度其中c,a为适当选择参数值,d(ui,uj)为模糊集各种距离.iii)算术平均最小贴近度(13)
4、主观评定法请有实际经验者直接对ui,uj的相似程度评分,作为rij的值.通过标定求出相似系数后,便可得到以rij为元素的模糊相似矩阵R(rij).4.聚类选择一种合适的聚类方法,便可得到分类结果.三、传递闭包法1.传递闭包法根据标定所得模糊矩阵R,求出其传递闭包为模糊等价矩阵,对,令λ从1降到0得到,根据进行分类:归为一类.2.最佳阈值λ的选取聚类图给出各λ值对应的分类,形成一种动态聚类,便于全面了解元素聚类,然后根据实际需要选择其阈值λ,便可确定元素的一种分类,至于如何选择阈值λ,使分类更加合理,除了凭经验外,
5、还可用F-统计量来选取.F-统计量:为待分类事物的全体,设xjk为描述元素uj第k个特征的数据.设c为对应于λ值的类数,ni为第i类元素的个数,第i类元素记为记为第i类元素的第k个特征的平均值,而称为第i类的聚类中心向量;为全体元素的中心向量,而于是,称为F-统计量,其中为第i类中元素与中心的距离.可见,F-统计量的分子表征类与类间的距离,分母表征类内元素间的距离.因此,F值越大,说明分类越合理,与此分类相对应的F-统计量最大的阈值λ为最佳值.求传递闭包的简便方法设为模糊相似矩阵,求t(A).(1)求,假定,把A
6、中的a1m,am1,a11,amm用圆圈圈起来,并记(2)在A中第一行、第m行中剩下的元素中找最大元素,即.且设在第p列.用即分别代替a1p与amp以及它们的对称元素,最后用圆圈将它们及圈起来.(3)假定A中有圈的k行是行.而所在的列是ij列,在这些行中剩下的元素中找最大元并设在第l行,用分别代替继续此过程,到k=n-1,得到t(A).还有逐步平方法:及其对称矩阵,并把all圈起来四、基于模糊相似关系的直接聚类法1.最大树法聚类原则是:ui与uj在λ水平同类当且仅当在相似矩阵R的图中,存在一条权重不低于λ的路联结
7、ui与uj.画出以被分类元素为结点,以相似矩阵R的元素rij为权重的一颗最大树;(2)取定,砍断权重低于λ的枝,得到一个不连通图,各连通分支变构成了在λ水平上的分类.2.编网法对给定的模糊相似矩阵R,取定水平,作截矩阵Rλ,在Rλ的主对角线上填入元素的符号,在对角线下方以结点号“*”代替1,而“0”则略去不写,由结点向主对角线上引经线和纬线,称之为编网,通过经线和纬线能互相连接起来的元素,属于同类,从而实现了分类.五、基于模糊划分的模糊聚类法1.c-划分(1)普通c-划分如果划分把普通集合分成c类,则此划分就叫普
8、通c-划分,即:若设的特征可表为,那么U的普通c-划分是指U的c个子集满足:(1)(2)其中且满足(1)(2)(表示每个uj必属于且仅属于一类);(表示每类Ai至少有一个元素);反过来,任一满足条件(1)、(2)、(3)的矩阵对应着U的一个分类.(1)(2)(3)这样的分类结果可以用一个c×n矩阵(称为c-划分)来表示.例如,设U={u1,u2,u3,u4},若分类结果为