欢迎来到天天文库
浏览记录
ID:51658443
大小:412.00 KB
页数:47页
时间:2020-03-27
《系统模型与模型化技术(参考).ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第4节系统聚类分析聚类要素的数据处理距离的计算直接聚类法最短距离聚类法最远距离聚类法系统聚类法计算类之间距离的统一公式系统聚类分析实例一、聚类要素的数据处理在聚类分析中,聚类要素的选择是十分重要的,它直接影响分类结果的准确性和可靠性。在地理分类和分区研究中,被聚类的对象常常是多个要素构成的。不同要素的数据往往具有不同的单位和量纲,其数值的变异可能是很大的,这就会对分类结果产生影响。因此当分类要素的对象确定之后,在进行聚类分析之前,首先要对聚类要素进行数据处理。假设有m个聚类的对象,每一个聚类对象
2、都有n个要素构成。它们所对应的要素数据可用表3.4.1给出。表3.4.1聚类对象与要素数据在聚类分析中,常用的聚类要素的数据处理方法有如下几种:①总和标准化。分别求出各聚类要素所对应的数据的总和,以各要素的数据除以该要素的数据的总和,即这种标准化方法所得到的新数据满足(3.4.1)②标准差标准化,即由这种标准化方法所得到的新数据,各要素的平均值为0,标准差为1,即有(3.4.2)③极大值标准化,即经过这种标准化所得的新数据,各要素的极大值为1,其余各数值小于1。④极差的标准化,即经过这种标准化所
3、得的新数据,各要素的极大值为1,极小值为0,其余的数值均在0与1之间。(3.4.3)(3.4.4)例题:表3.4.2给出了某地区9个农业区的7项指标,它们经过极差标准化处理后,如表3.4.3所示。表3.4.2某地区9个农业区的7项经济指标数据区代号人均耕地X1/(hm2·人-1)劳均耕地X2/(hm2·个-1)水田比重X3/%复种指数x4/%粮食单产x5/(kg·hm-2)人均粮食x6/(kg·人-1)稻谷占粮食比重x7/%G10.2941.0935.63113.64510.51036.412.
4、2G20.3150.9710.3995.12773.5683.70.85G30.1230.3165.28148.56934.5611.16.49G40.1790.5270.391114458632.60.92G50.0810.21272.04217.812249791.180.38G60.0820.21143.78179.68973636.548.17G70.0750.18165.15194.710689634.380.17G80.2930.6665.3594.93679.5771.77.8G9
5、0.1670.4142.994.84231.5574.61.17表3.4.3极差标准化处理后的数据x1x2x3x4X5X6X7G10.911.000.070.150.181.000.14G21.000.870.000.000.000.240.00G30.200.150.070.440.440.080.07G40.440.380.000.130.180.130.00G50.030.031.001.001.000.451.00G60.030.030.610.690.650.130.59G70.000
6、.000.900.810.840.131.00G80.910.530.070.000.100.430.09G90.380.260.040.000.150.000.00二、距离的计算常见的距离有①绝对值距离②欧氏距离③明科夫斯基距离(3.4.5)(3.4.6)(3.4.7)④切比雪夫距离。当明科夫斯基距时,有据表3.4.3中的数据,用公式(3.4.5)式计算可得9个农业区之间的绝对值距离矩阵如下(3.4.8)(3.4.9)三、直接聚类法原理先把各个分类对象单独视为一类,然后根据距离最小的原则,依次
7、选出一对分类对象,并成新类。如果其中一个分类对象已归于一类,则把另一个也归入该类;如果一对分类对象正好属于已归的两类,则把这两类并为一类。每一次归并,都划去该对象所在的列与列序相同的行。经过m-1次就可以把全部分类对象归为一类,这样就可以根据归并的先后顺序作出聚类谱系图。例题:根据距离矩阵式(3.4.9),用直接聚类法对某地区的9个农业区进行聚类分析,步骤如下:(1)在距离矩阵D中,除去对角线元素以外,d49=d94=0.51为最小者,故将第4区与第9区并为一类,划去第9行和第9列;(2)在余下
8、的元素中,除对角线元素以外,d75=d57=0.83为最小者,故将第5区与第7区并为一类,划掉第7行和第7列;(3)在第2步之后余下的元素之中,除对角线元素以外,d82=d28=0.88为最小者,故将第2区与第8区并为一类,划去第8行和第8列;(4)在第3步之后余下的元素中,除对角线元素以外,d43=d34=1.23为最小者,故将第3区与第4区并为一类,划去第4行和第4列,此时,第3、4、9区已归并为一类;(5)在第4步之后余下的元素中,除对角线元素以外,d21=d12=1.52为最小者,故将第
此文档下载收益归作者所有