欢迎来到天天文库
浏览记录
ID:61748457
大小:1.43 MB
页数:38页
时间:2020-02-06
《第3章——第4节 系统聚类分析《计量地理学》(华东师大,徐建华).ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、§3.4系统聚类分析方法聚类要素的数据处理距离的计算直接聚类法最短距离聚类法最远距离聚类法系统聚类法计算类之间距离的统一公式系统聚类分析实例一、聚类要素的数据处理当分类要素的对象确定之后,在进行聚类分析之前,首先要对聚类要素进行数据处理。假设有m个聚类的对象,每一个聚类对象都有n个要素构成。它们所对应的要素数据可用3.4.1给出。聚类对象要素在聚类分析中,常用的聚类要素的数据处理方法有如下几种:①总和标准化。分别求出各聚类要素所对应的数据的总和,以各要素的数据除以该要素的数据的总和,即这种标准化方法所得到的新数据满足(3.4.1)②标准差标准化,即由这种标准化方法所得到的新数据,各
2、要素的平均值为0,标准差为1,即有(3.4.2)③极大值标准化,即经过这种标准化所得的新数据,各要素的极大值为1,其余各数值小于1。④极差的标准化,即经过这种标准化所得的新数据,各要素的极大值为1,极小值为0,其余的数值均在0与1之间。(3.4.3)(3.4.4)例题:表3.4.2给出了某地区九个农业区的七项指标,它们经过极差标准化处理后,如表3.4.3所示。表3.4.2某地区九个农业区的七项经济指标数据区代号人均耕地x1(hm2/人)劳均耕地x2(hm2/个)水田比重x3(%)复种指数x4(%)粮食亩产x5(kg/hm2)人均粮食x6(kg/人)稻谷占粮食比重x7(%)G10.2
3、941.0935.63113.64510.51036.412.2G20.3150.9710.3995.12773.5683.70.85G30.1230.3165.28148.56934.5611.16.49G40.1790.5270.391114458632.60.92G50.0810.21272.04217.812249791.180.38G60.0820.21143.78179.68973636.548.17G70.0750.18165.15194.710689634.380.17G80.2930.6665.3594.93679.5771.77.8G90.1670.4142.9
4、94.84231.5574.61.17表3.4.3极差标准化处理后的数据x1x2x3x4X5X6X7G10.911.000.070.150.181.000.14G21.000.870.000.000.000.240.00G30.200.150.070.440.440.080.07G40.440.380.000.130.180.130.00G50.030.031.001.001.000.451.00G60.030.030.610.690.650.130.59G70.000.000.900.810.840.131.00G80.910.530.070.000.100.430.09G90.
5、380.260.040.000.150.000.00二、距离的计算常见的距离有①绝对值距离②欧氏距离③明科夫斯基距离(3.4.5)(3.4.6)(3.4.7)④切比雪夫距离。当明科夫斯基距时,有据表3.4.3中的数据,用公式(3.4.5)式计算可得九个农业区之间的绝对值距离矩阵如下:(3.4.8)(3.4.9)三、直接聚类法原理:先把各个分类对象单独视为一类,然后根据距离最小的原则,依次选出一对分类对象,并成新类。如果其中一个分类对象已归于一类,则把另一个也归入该类;如果一对分类对象正好属于已归的两类,则把这两类并为一类。每一次归并,都划去该对象所在的列与列序相同的行。经过m-1次
6、就可以把全部分类对象归为一类,这样就可以根据归并的先后顺序作出聚类谱系图。例:根据距离矩阵(3.4.9)式,用直接聚类法对某地区的九个农业区进行聚类分析,步骤如下:①在距离矩阵D中,除去对角线元素以外,d49=d94=0.51为最小者,故将第4区与第9区并为一类,划去第9行和第9列;②在余下的元素中,除对角线元素以外,d75=d57=0.83为最小者,故将第5区与第7区并为一类,划掉第7行和第7列;③在第二步之后余下的元素之中,除对角线元素以外,d82=d28=0.88为最小者,故将第2区与第8区并为一类,划去第8行和第8列;④在第三步之后余下的元素中,除对角线元素以外,d43=d
7、34=1.23为最小者,故将第3区与第4区并为一类,划去第4行和第4列,此时,第3、4、9区已归并为一类;⑤在第四步之后余下的元素中,除对角线元素以外,d21=d12=1.52为最小者,故将第1区与第2区并为一类,划去第2行和第2列,此时,第1、2、8区已归并为一类;⑥在第五步之后余下的元素中,除对角线元素以外,d65=d56=1.78为最小者,故将第5区与第6区并为一类,划去第6行和第6列,此时,第5、6、7区已归并为一类;⑦在第六步之后余下的元素中,除对角线元素以
此文档下载收益归作者所有