北航地应用数理统计大作业-聚类分析报告报告材料

北航地应用数理统计大作业-聚类分析报告报告材料

ID:36729883

大小:122.81 KB

页数:17页

时间:2019-05-14

北航地应用数理统计大作业-聚类分析报告报告材料_第1页
北航地应用数理统计大作业-聚类分析报告报告材料_第2页
北航地应用数理统计大作业-聚类分析报告报告材料_第3页
北航地应用数理统计大作业-聚类分析报告报告材料_第4页
北航地应用数理统计大作业-聚类分析报告报告材料_第5页
资源描述:

《北航地应用数理统计大作业-聚类分析报告报告材料》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、实用标准文案应用数理统计聚类分析与判别分析(第二次作业)学院:姓名: 学号:精彩文档实用标准文案2013年12月16日精彩文档实用标准文案我国各地区居民消费水平的聚类分析和判别分析摘要:本文基于《中国统计年鉴》(2012年版)统计数据,寻找评价各省份人民消费水平的指标,包括居民消费水平、农村居民消费水平、城镇居民消费水平和居民人均消费四个指标,利用统计软件SPSS综合考虑各指标,对全国各省份进行K-Means聚类分析,利用Fisher线性判别待判城市类型,进一步验证所建模型的有效性。关键字:聚类分析,判别分析

2、,SPSS,居民消费水平1,引言人均消费水平是指一定时期内(月、年)平均每人占有和享受的物质生活资料和服务的数量。它是一个国家整个经济活动成果的最终体现,也是反映人民物质和文化生活需要的满足程度。一个国家的国民生产总值(GNP)除以该国国民人口的总数所得出的商。即指分摊到每个国民份上的国民生产总值的平均值。在经济学上,一般用来衡量或表示一个国家的经济发展程度。经过改革开放后三十多年的长足进展,尽管世界格局在走向多极化的过程中不断呈现出错综复杂、风云变幻的局面,但中国领导人高瞻远瞩,始终不渝地坚持以经济建设为中

3、心,坚持走和平发展的道路,使中国步履稳健、坚定不移地走向世界,融入经济全球化的历史进程之中。中国在为经济全球化作出贡献的同时,也从中获取了巨大的增长动力,中国人民的生活水平和消费水平也在不断提高。精彩文档实用标准文案2014年全国居民人均可支配收入20167元,比上年增长10.1%,扣除价格因素,实际增长8.0%。按常住地分,城镇居民人均可支配收入28844元,比上年增长9.0%,扣除价格因素,实际增长6.8%;城镇居民人均可支配收入中位数为26635元,增长10.3%。农村居民人均可支配收入10489元,比

4、上年增长11.2%,扣除价格因素,实际增长9.2%;农村居民人均可支配收入中位数为9497元,增长12.7%。全年农村居民人均纯收入为9892元。全国居民人均消费支出14491元,比上年增长9.6%,扣除价格因素,实际增长7.5%。按常住地分,城镇居民人均消费支出19968元,增长8.0%,扣除价格因素,实际增长5.8%;农村居民人均消费支出8383元,增长12.0%,扣除价格因素,实际增长10.0%。但是,经济和消费水平的增长比例关系却不尽如人意,经济增长大大慢于消费增长,消费需求对经济增长的贡献率不断下降

5、并成为当前经济运行中的重要问题。为实现扩大内需、拉动经济增长的长效目的,我们要在洞察当前居民消费现状的基础上,深入分析居民消费增长缓慢的原因,并探索扩大居民消费需求、拉动经济增长的对策和措施。所以我希望通过对居民消费情况进行分析,得到影响居民消费水平的地域因素和其他影响因子等。2,相关统计基础理论2.1,聚类分析聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。聚类分析的目标就是在相似的基础上收集数据来分类。从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分

6、析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用k-均值、k-中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如SPSS、SAS等。本文使用统计软件SPSS对所收集的数据进行快速聚类,其特点是:在确定类别数量基础上,先给定一个粗糙的初始分类,然后按照某种原则进行反复修改,直至分类较为合理。在选定类中心作为凝聚点的基础上进行分类和修正的方法有很多,本文使用的是K-Means算法。K-Means算法接受输入量k;然后将n个数据对象划分为k个聚类以便使得所

7、获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。K-Means算法的工作过程说明如下:首先从n个数据对象任意选择k精彩文档实用标准文案个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标

8、准测度函数。一般而言,k个聚类具有以下特点:各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。2.2,判别分析判别分析是市场研究的重要分析技术,也是多变量分析技术。它可以就一定数量的个体的一个分类变量和相应的其它多元变量的已知信息,确定分类变量与其它多元变量之间的数量关系,建立判别函数,并利用判别函数构建Biplot二元判别图(概念图)。同时,利用这一数量关系对其他已知多元变量的信息、但未知分组的子

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。