北航数理统计聚类分析大作业.

北航数理统计聚类分析大作业.

ID:15259538

大小:1.40 MB

页数:16页

时间:2018-08-02

北航数理统计聚类分析大作业._第1页
北航数理统计聚类分析大作业._第2页
北航数理统计聚类分析大作业._第3页
北航数理统计聚类分析大作业._第4页
北航数理统计聚类分析大作业._第5页
资源描述:

《北航数理统计聚类分析大作业.》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、应用数理统计地区生产总值及经济发展状况的聚类和判别分析摘要:本文选取了06、07年地区生产总值的各项指标数据,运用统计学方法对其经济发展状况进行了分类研究。分析结果显示,北京﹑山东﹑上海﹑广东等东部沿海地区在经济发展中处于领先地位,属于经济较发达地区;辽宁﹑湖南﹑河南等省份处于中游,属于中等发达地区;西藏﹑青海﹑宁夏等中西部省份,经济发展较为缓慢,属于欠发达地区。分析结果与我国目前地区经济发展情况基本相符。通过本次研究揭示了我国的经济优势地区和经济薄弱地区,这对国家进行统筹规划、实现共同富裕具有重要意义。关键词:生产

2、总值,经济发展,SPSS,聚类分析,判别分析目录1引言21.1源数据的提取22地区经济发展的聚类分析和判别分析22.1相关自变量的选择22.2聚类分析22.3判别分析23总结21引言国内生产总值(GrossDomesticProduct,简称GDP)是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为衡量国家经济状况的最佳指标。它不但可以反映一个国家的经济表现,还可以反映一国的国力与财富。地区生产总值(GrossRegionalProduct,简称GRP,或者Gro

3、ssRegionalDomesticProduct简称GRDP)为一个特定区域(常为一个国家的行政区域)经济产出的指标,指区域内各个产业增加值的总和。地区生产总值可以较为准确反映地区经济发展状况,通过建立地区生产总值模型,对各地区经济发展状况进行分类,具有一定的准确性和合理性。本文应用数理统计软件SPSS对各地区生产总值进行聚类分析和判别分析,分析和评定各地区经济发展情况,同时对各地区进行分类,确定经济优势地区和经济薄弱地区。1.1源数据的提取本文所用的数据全来自《中国统计年鉴2007》和《中国统计年鉴2008》,从

4、中提取了有关北京市、河北省等31个省市、自治区、直辖市(不包括港澳台地区)2006、2007年的生产总值的各项指标数据,见表1、表2(单位:亿元)。表106年地区生产总值各项指标数据表207年地区生产总值各项指标数据2地区经济发展的聚类分析和判别分析地区生产总值主要包括的内容有:(1)第一产业是农业,包括:林业、牧业、渔业等;(2)第二产业是工业,包括:采掘业、制造业、自来水、电力、蒸汽、热水、煤气业)和建筑业;(3)第三产业是除上述各业以外的其它产业,主要包括:交通运输业、仓储和邮政业、批发和零售业、住宿和餐饮业、

5、金融业、房地产业及其他产业。2.1相关自变量的选择本文从分析各地区生产总值的主要内容出发,展开对地区经济发展的聚类分析。鉴于第一产业的各个元素在地区生产总值中所占比重不大,为了便于分析,我们将农林牧渔等第一产业部分合为一类,与工业、建筑业、交通运输、仓储和邮政业、批发和零售业、住宿和餐饮业、金融业、房地产业、其他产业等元素一起作为自变量进行聚类分析和判别分析。需要聚类和判别的地区为北京、上海等31个省市、自治区、直辖市(不包括港澳台地区)。2.2聚类分析首先采取系统聚类法(hierarchicalcluster)对所

6、有31个地区聚类进行分析(数据为2007年度地区生产总值),表3表示所有观测量都已加入聚类判别分析。表4为聚类分析进度表,表中列出了观测量或类合并的详细步骤。表3处理过程汇总表4聚类表图1树状谱系图图1为分析得到的树状谱系图,图中横向聚类表示差异的大小,从图中可以清晰的看出整个的观测量的聚类过程。分析结果显示,青海、宁夏、海南、西藏、贵州、甘肃、重庆、新疆和云南等省份可以划归一类,它们在经济发展中处于不利地位,是经济欠发达地区。北京、河北、河南、上海、浙江、江苏、山东、广东等省份作为经济较发达地区,可以划归另一类。其

7、余省份划归第三类,为经济中等发达地区。在此分类的基础上可以对结果进行判别分析,继而确定聚类结果的准确性。2.3判别分析为了鉴别以上聚类分析结果是否准确,我们选取2006年的数据对上述分类进行判别分析。这里我们选用Fisher判别法构造判别函数,分析结果如下:表5案例分析过程表5表明所有变量都进入了判别分析。表6输入/删除的变量用逐步分析方法选择用于构造判别函数的变量。表7分析中的变量表8特征值Eigenvalues代表用于分析的前两个典则判别函数的特征值,是组间平方和与组内平方和之比值。最大特征值与组均值最大的向量对

8、应,第二大特征值对应着次大的组均值向量。表9标准化的典则判别式函数系数标准化的典则判别式函数系数(使用时必须用标准化的自变量)。由图可知Fisher判别法构造的两个典则判别函数为:Y1=1.275X1+1.824X2-1.654X3Y2=-0.639X1-0.815X2-0.065X3表10分类结果从表10分类结果中可以看出初始分组的正确率。表

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。