欢迎来到天天文库
浏览记录
ID:22958103
大小:157.50 KB
页数:10页
时间:2018-11-02
《各省市经济类型聚类分析》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、各省市经济类型分析SY0906611陆启超摘要判别分析(Discriminate)和聚类分析(HierarchicalCluster)是进行统计分类的两种常用方法,本文利用这两种方法对于全国几个省市的按经济类和经济状况进行分类,并制定一定的分类规则(即判别函数),以便对于新加的样品能够按照这些规则进行很快的分类。一个省市的经济类型和地区生产总值、三种产业在国内生产总值占的比重等因素相关。本文利用统计软件SPSS对全国各省市以上各方面2007年的统计数据进行聚类分析,得到了对各省市经济类型的分类结果,并通过验证三个特殊省份的经济类型,保证结果的正确性。分
2、析结果反映了这些省市的经济类型和经济特点。关键字:聚类分析判别分析经济类型MATLAB引言中国经济在总体上发展迅速,但是区域发展不平衡的矛盾也日益突出,各地区由于各种因素经济类型呈现出巨大差异。英国经济统计学家C.G.Clark在1940年发表的《经济进步的条件》中,从若干国家经济统计数据中证明了随着经济的发展,人口的就业结构亦将发生相应变化。美国著名经济学家S.Kuznetz又对产业结构与经济发展的关系作了更深入的研究,在《现代经济增长》和《各国经济增长的数量分析》中指出经济的发展也必将引起产值结构的变化。1聚类分析方法简介聚类分析的基本思想是,从一
3、批样品的多个观测指标变量中,定义能度量样品间相似程度的统计量,在此基础上求出各个样品之间的相似程度的度量值,按相似程度的大小,将样品逐一归类,关系密切的聚集到一个小的分类单位,关系疏远的聚集到一个大的分类单位,直到所有的样品都聚集完毕,把不同类型一一划分出来,形成一个亲疏关系谱系图,用以更加直观的显示分类对象的差异和联系。聚类分析的原则是同一类中的个体有较大的相似性,不同类的个体差异很大。根据分类对象不同,聚类分析分为样本聚类和变量聚类,即统计学上的Q型聚类和R型聚类。常见的聚类分析方法有快速样本聚类和分层聚类。快速样本聚类的前提是要已知将要聚成的类数
4、,这样在使用这种聚类法的过程中能够很快的将观测量分到各类中去。分层聚类方法根据聚类过程不同分为凝聚法和分解法。分解法,就是在聚类开始的时候,把所有个体都视为属于一个大类,然后根据距离和相似性逐层分解,直到参与聚类的每个个体自成一类为止;而凝聚法刚好相反,它是在一开始把参与聚类的每个个体视为一类,根据两类之间的距离或相似性逐步合并,直到合并成一个大类为止。1.1直接聚类法先把各个分类对象单独视为一类,然后根据距离最小的原则,依次选出一对分类对象,并成新类。如果其中一个分类对象已归于一类,则把另一个也归入该类;如果一对分类对象正好属于已归的两类,则把这两类
5、并为一类。每次归并,都划去该对象所在的列与列序相同的行。经过没m-1次就可以把全部分类对象归类,这样就可以根据归并的先后顺序作出聚类谱系图。1.2最短距离聚类法最短距离聚类法在原来的m×m矩阵的非对角元素中找出,把分类对象Gp和Gq归并为新类Gr,然后按计算公式计算原来原来各类与新类之间的距离,这样就得到一个新的m-1阶的距离矩阵;再从新矩阵中选出最小者dij,把Gi和Gj归并成新类;再计算各类与新类的距离,这样一直下去,知道各分类对象被归为一类。1.3最远距离聚类法其与最短距离聚类法的区别在于计算原来的类与新类距离时采用的公式不同。其使用的是最远距离
6、来衡量样本之间的距离。2对各省市经济类型的聚类分析一个省市的经济类型和众多因素比如地理位置、国民生产总值、人口素质等息息相关,本文利用统计软件MATLAB7.0,对北京市等省市2008年的人均地区生产总值(亿元)、职工平均工资(元)、从事第一、二、三产业的人的比例作为判别经济类型的五个因素,进行聚类分析。根据地区发展的特点大概把我国划分为八大经济区域:南部沿海地区、东部沿海地区、北部沿海地区、东北地区、长江中游地区、黄河中游地区、西南地区、西北地区。希望通过这八大经济区的划分,来进行经济区的统一考虑,加强区域间的联系。2.1数据整理下表是全国所有省市的
7、相关统计数据,数据来源为《中国统计年鉴2009》。其中浙江、辽宁、云南三省的数据留作判别分析用。地区地区生产总值(亿元)人口(人)职工平均工资(元)第一产业(%)第二产业(%)第三产业(%)北京9353.321695558445.621.872.5天津5050.4011763999015.540.544.0河北13709.5069892427640.832.726.5山西5733.3534112548940.626.433.0内蒙古6091.1224142594950.516.932.7 辽宁11023.4943152717933.325.541.2吉
8、林5284.6927342329444.719.935.4黑龙江7065.0038252176
此文档下载收益归作者所有