北航数理统计第二次数理统计大作业 判别分析.

北航数理统计第二次数理统计大作业 判别分析.

ID:11646206

大小:666.50 KB

页数:19页

时间:2018-07-13

北航数理统计第二次数理统计大作业 判别分析._第1页
北航数理统计第二次数理统计大作业 判别分析._第2页
北航数理统计第二次数理统计大作业 判别分析._第3页
北航数理统计第二次数理统计大作业 判别分析._第4页
北航数理统计第二次数理统计大作业 判别分析._第5页
资源描述:

《北航数理统计第二次数理统计大作业 判别分析.》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数理统计大作业(二)全国各省发展程度的聚类分析及判别分析数理统计大作业(二)全国各省发展程度的聚类分析及判别分析指导教师院系名称材料科学与工程院学号学生姓名2015年 12月21日数理统计大作业(二)全国各省发展程度的聚类分析及判别分析目录全国各省发展程度的聚类分析及判别分析1摘要:1引言11实验方案21.1数据统计21.2聚类分析31.3判别分析42结果分析与讨论52.1聚类分析结果52.2聚类分析结果分析:82.3判别分析结果92.4Fisher判别结果分析:11参考文献:1616数理统计大作业(二)全国各省发展程度的聚类

2、分析及判别分析全国各省发展程度的聚类分析及判别分析摘要:利用SPSS软件对全国31个省、直辖市、自治区(浙江、安徽、甘肃除外)的主要经济指标进行多种聚类分析,分析选择最佳聚类类数,并对浙江、湖南、甘肃进行类型判别分析。通过这两个方法对全国各省进行发展分类。本文选取了7项社会发展指标作为决定发展程度的影响因素,其中经济因素为主要因素,同时评估城镇化率和人口素质因素。各项数据均来自2014年国家统计年鉴。分析结果表明:北京市和上海市和天津市为同一类;江苏省和山东省和广东省为同一类型;河北、湖北、河南、湖南、四川、辽宁为同一类;其余

3、的为另一类。关键词:聚类分析、判别分析、发展引言聚类分析是根据研究对象的特征对研究对象进行分类的多元统计分析技术的总称。它直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。系统聚类分析又称集群分析,是聚类分析中应用最广的一种方法,它根据样本的多指标(变量)、多个观察数据,定量地确定样品、指标之间存在的相似性或亲疏关系,并据此连结这些样品或指标,归成大小类群,构成分类树状图或冰柱图。判别分析是根据多种因素(指标)对事物的影响来实现对事物的分类,从而对事物进行判别分类的统计方法。判别分析适用于已经掌握了

4、历史上分类的每一个类别的若干样品,希望根据这些历史的经验(样品),总结出分类的规律性(判别函数)来指导未来的分类。聚类分析与判别分析都是研究分类的,但是它们有所区别:(1)16数理统计大作业(二)全国各省发展程度的聚类分析及判别分析聚类分析一般寻求客观的分类方法,在进行聚类分析以前,对总体到底有几种类型并不知道。判别分析则是在总体类型划分已知,在各总体分布或来自总体训练样本的基础上,对当前的新样本判定它们属于哪个总体。(2)两类方法的建立的模型不一样,因此在处理某些特定的问题时,就会得出不一样的结果,就本题看来,出现了经济类型

5、上的判别不一致的细微差异,但是作为分类方法来说,两种方法在大部分情况下都能取得一致的效果。(3)聚类分析与判别分析也是有联系的。如我们对研究的多元数据的特征不熟悉,当然要先进行聚类分析,才能考虑判别分析的问题。随着改革开放的进行,我国进入了一个前所未有的经济飞速发展时期,整体经济实力与日俱增。但是,我们也应该看到各个地区的发展不平衡,沿海地区发展较快,经济增长也较快,而中西部发展相对较慢。因此,基于这种现状,本文对全国各地区的经济进行聚类分析。首先对除浙江、安徽、甘肃三省的其他各省经济进行聚类,然后对浙江、安徽、甘肃三省的经济

6、类型进行判别分析。通过本文的分析研究,可以清楚地认识到我国经济类型构成,以及各地区的发展差异。本文采用多元统计分析方法,对全国31个省、直辖市、自治区的7项经济指标进行聚类分析和判别分析,从而能够比较客观地反映了当前各地区的发展程度。1实验方案1.1数据统计本文根据2014年国家统计年鉴,选取了2013年31个省、直辖市、自治区的7项经济指标[1],如表1所示。其中包括:、第一产业生产总值X1、第二产业生产总值X2、第三产业生产总值X3、固定资产投资X4,外商投资总值X5,城镇人口比X6,高等教育人口(大专及以上)X7。其中第

7、二产业包括工业建筑业。第三产业包括交通运输、仓储,批发和零售业,住宿和餐饮业,金融业,房地产业和其他.高等教育人口是是2013年全国人口变动情况抽样调查样本数据,抽样比为0.822‰。16数理统计大作业(二)全国各省发展程度的聚类分析及判别分析1.2聚类分析将表1所示的31个省、直辖市、自治区(除浙江、安徽和甘肃)2013年的各项数据导入SPSS。为了便于分析,在聚类分析前,先对数据进行标准差标准化处理,其过程为:“Analyze→DescriptiveStatistics→Descriptives…”,然后对标准差标准化后的

8、数据进行聚类分析(HierarchicalClusterAnalysis)。其过程为:依次选择“Analyze→Classify→HierarchicalCluster”,引入的变量是X1至X7。从而对样品(个案)进行聚类,即Q型聚类分析(对研究对象本身分类)。聚类方法使用B

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。