聚类与判别分析作业

聚类与判别分析作业

ID:12477299

大小:328.09 KB

页数:12页

时间:2018-07-17

聚类与判别分析作业_第1页
聚类与判别分析作业_第2页
聚类与判别分析作业_第3页
聚类与判别分析作业_第4页
聚类与判别分析作业_第5页
资源描述:

《聚类与判别分析作业》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、利用SPSS对全国各省进行经济类型聚类和判别分析摘要:本文利用SPSS统计软件对中国大陆(除港、澳、台之外)的31个省、市、自治区2000年到2009年的经济总量进行聚类分析,将这31个省、市、自治区分为了三大类,即经济发达地区、中等水平区、经济落后区。并以这31个省级行政区10年的经济数据为样本,进行判别分析,建立了Fisher判别模型。从判回代统计表可以看出该判别模型有着很高的正确率。关键词:SPSS聚类分析判别分析Fisher判别法一、引言利用各省以往经济数据对各省进行经济类型的划分,有助于了解各省的经济发展的状况,特别是

2、能有助于了解全国各区域经济发展状况。这对于相关部门制定相应的经济政策有一定的参考意义。本文利用SPSS统计软件对全国31个省级行政区近10年的经济总量进行了聚类分析,把这31个地区划分为三个大类,即经济发达地区、中等水平区、经济落后区,然后对分好的类进行了判别分析,建立了判别函数。从结果可以看出,其判别效果较好。二、聚类分析和判别分析简介1、聚类分析法俗话说:“物以类聚,人以群分”。对研究对象进行适当的分类,进而发现其规律性,是人们认识世界的一种基本方法。研究怎样对事物进行合理分类(归类)的统计方法称为聚类分析。依据分类对象的不

3、同可以把聚类分析再分成Q型聚类和R型聚类,Q聚类是对样品进行聚类,R聚类是指对变量进行聚类。聚类分析的基本原理是把某种性质相似的对象归于同一类,而不同的类之间则存在较大的差异。为此,首先需要能刻画各个变量之间或者各个样本点之间的相似性,Q聚类一般使用“距离”度量样本点之间的相似性,R聚类则使用“相似系数”作为变量相似性的度量。定义样本之间的距离可以采用欧氏距离、明考夫斯基距离、马氏距离、兰氏距离等测度;定义各变量之间的相似系数则多采用样本相关系数、夹角余弦等测度。系统聚类法(HierarchicalClusteringMetho

4、d)是最常用的一种聚类方法。初始时先把要归类的n个对象各自视为一类,然后逐渐把关系最密切的两个类合并成一个新类,直到最后把n个对象都归为一类时停止。这种聚类过程可以用一张聚类谱系图形象地展示出来。2、判别分析法判别分析又称“分辨法”,是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。进行判别分析必须已知观测对象的分类和若干表明观测对象特征的变量值。判别就是要从中筛选出能提供较多信息的变量并建立判别函数,使得利用推导出的判别函数对观测量判别其所属类别时的错判率最小。判别函数一般形式是:其

5、中:为判别分数(判别值);为反映研究对象特征的变量,为各变量的系数,也称判别系数。SPSS对于分为m类的研究对象,建立m个线性判别函数。对于每个个体进行判别时,把测试的各变量值代入判别函数,得出判别分数,从而确定该个体属于哪一类。或者计算属于各类的概率,从而判断该个体属于哪一类。SPSS提供的判别分析过程是Discriminant过程。三、聚类分析过程表3.1中国各省2000年到2009年GDP地区2000年(亿元)2001年(亿元)2002年(亿元)2003年(亿元)2004年(亿元)2005年(亿元)2006年(亿元)200

6、7年(亿元)2008年(亿元)2009年(亿元)广东9662.2310556.51100013788.91604021701.2825969306733569639082江苏8582.739514.61000012098.81500018272.122154825560.13100034061山东8542.449438.3105001037815490.718468.32170025887.731072.133805浙江6036.3467007400979811243133651564918638.421486.922832河南

7、5137.66564560007074.098815.0910535.24356152201820019367河北5088.965577.755007060.48836.910116.6425613863.516188.617027辽宁4669.065033.146006030.66872.657920925711021.7313461.615065上海4551.454950.854006250.847450.279125102971200113698.1514901四川4010.254421.848005456.2655673

8、85.1836710505.312506.314151湖南3691.883983420046335612.2662377493914511156.6412930湖北4276.324662.350005395.956320600074979006.211330.3

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。