欢迎来到天天文库
浏览记录
ID:57225808
大小:2.90 MB
页数:48页
时间:2020-08-04
《模糊聚类分析课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、模糊聚类分析物以类聚对事物按一定要求进行分类的数学方法,叫做聚类分析。现实的分类问题,大多伴随着模糊性。如地质上水油层之间的边界是不分明的,对农业区划的分界、土壤的分类、空气污染等级、公司竞争力也是模糊的等等。利用模糊聚类分析法去对地质分类,进行农业区划就更合理。一、基本概念及定理求传递闭包:平方法1.确定聚类单元这是第一步工作。在确定聚类单元时,主要根据研究对象和聚类的目的进行综合分析来确定。如研究的对象是三江平原大系统,则聚类单元以县为单位较妥;如研究对象是某个县,则以乡为单元较妥;如研究的目的是将耕地按肥力不同分成不同的类别,则以地块作为聚类单元。这里有一点
2、需要注意,不管单元如何划定,保证行政区划的完整性是必要的,只有如此,才能确保把聚类结果应用到实际生产中去。二、模糊聚类的一般步骤2.确定聚类准则和聚类因子聚类准则又叫聚类原则,是对聚类目的性的概括描述,也是筛选聚类因子的基本依据。如气候条件准则、经济发展水平准则、土壤肥力准则等。不难看出,这三个准则将指导把聚类单元分成不同气候区、经济发展区和土壤肥力分类等。根据聚类准则要进一步确定聚类因子,这项工作应请有关专家参与,以便把握住与准则密切相关的特征参数,确保聚类的精确性。根据需要可同时选择不同准则分别进行聚类分析,然后通过综合取交的方法,以做到兼顾多目标,使分类
3、结果更科学。3、建立数据矩阵(1)标准差标准化(2)极差正规化(3)极差标准化(4)最大值规格化其中:4、建立模糊相似矩阵(1)相似系数法①夹角余弦法②相关系数法(2)距离法①Hamming距离②Euclid距离③Chebyshev距离海明欧式切比雪夫(3)贴近度法①最大最小法②算术平均最小法③几何平均最小法5.求模糊等价矩阵用上述方法建立起来的模糊矩阵,一般说来只满足自反性和对称性,不一定满足传递性,即不一定是模糊等价关系,需要将改造成模糊等价矩阵,然后再在适当的阈值上进行截取,便可得所需分类。改造的方法是将自乘得,再自乘,如此继续下去,得……,至某一步出现为止
4、。则便是一个模糊等价关系。这个方法是由所谓“传递闭包”理论而来,我们在此拿来直接应用,不再作详细介绍。6.截取等价类模糊等价关系矩阵为系统聚类奠定了基础,要想在此基础上进行分类,还必须将模糊等价关系转变成非模糊的等价关系。为此定义模糊等价关系矩阵的截矩阵如下:设为U上的一个模糊等价关系矩阵,且,则对任意一个,定义则称为的一个截矩阵。很显然,取不同的值就对应不同的分类结果,从而可以根据实际情况进行分类。根据结果可知,取值越大,分类就越细,这无疑对更精确地研究问题是有利的。但如果一个单元划为一类,不仅工作量巨大,而且失去了聚类的意义。相反,取值越小,分的类
5、就越少(粗),同样这对研究问题也是不可取的。当然,究竞将系统划分为几类,还应结合具体情况作具体分析,特别是要注意征询有关专家的意见,在多数专家认可的情况下,才做为最终的结果输出。7.撰写聚类分析报告聚类分析是一项独立的研究工作,这项工作完成的好坏关系全局。作为聚类分析报告一般应包括以下几部分内容:1.聚类分析的目的和意义。2.聚类分析所采用的方法和研究结果。3.结果分析。这部分的主要工作是将不同类上的基本情况和特征参数进行综合分析,指出不同类的特点,发展优势和问题等。解:由题设知特性指标矩阵为采用最大值规格化法将数据规格化为用最大最小法构造模糊相似矩阵得到用
6、平方法合成传递闭包取,得取,得取,得取,得取,得画出动态聚类图如下:0.70.630.620.531总体样本的中心向量对样本空间(为样本总数),,其中为分类特征个数,为的第个特征。设为对应值的类数,为第类的样本数,第类样本为。第类的聚类中心为向量其中,为该类样本第个特征的平均值,即总体样本的中心向量为,其中构造下列形式的F统计量,其中,为与的距离,为第类中样本与的距离。统计量分子表征类与类之间的距离,分母表示类内样本间距离,因此值越大,说明类与类之间的距离大,表明类与类间的差异大,分类就越合理。对应于统计量最大的水平即为最佳阈值。模糊聚类分析的简要流程:YN企业综
7、合竞争力评价分类5个公司6个指标的样品数据如下,试根据以下数据评价5个公司的综合竞争力。
此文档下载收益归作者所有