多元统计分析论文

多元统计分析论文

ID:13709440

大小:334.50 KB

页数:14页

时间:2018-07-24

多元统计分析论文_第1页
多元统计分析论文_第2页
多元统计分析论文_第3页
多元统计分析论文_第4页
多元统计分析论文_第5页
资源描述:

《多元统计分析论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、多元统计分析实践论文院系:理学院专业:统计学年级:2010姓名:樊恩泽学号:20101004005我国城镇居民人均消费支出的多元统计分析樊恩泽摘要:本文本文综合了主成分因子分析与系统聚类分析,先进行主成分因子分析,再用进行聚类分析。采用2011年我国31个省、市、自治区城镇居民人均消费支出数据,首先利用主成分因子分析的方法,找出影响我国城镇居民人均消费支出的主成分,计算各样本的主成分得分;其次运用系统聚类分析法,对各地区人均消费水平进行分类,结果表明,系统聚类分析法得到的结果也较好;最后对于扩大国内消费提出相关建议。关键词:主成分分析聚类分析居民人均消费支出1、引言人均

2、消费支出指居民用于满足家庭日常生活消费的全部支出,包括购买实物支出和服务性消费支出。消费支出按商品和服务的用途可分为食品、衣着、家庭设备用品及服务、医疗保健、交通和通讯、娱乐教育文化服务、居住、杂项商品和服务等八大类。人均消费支出是社会消费需求的主体,是拉动经济增长的直接因素,是体现居民生活水平和质量的重要指标。本文选取2011年我国城镇居民人均消费支出数据,主要利用三种统计方法进行分析:主成分分析法、聚类分析法。将全国31个省、市、自治区进行分类和排序,并与人们实际观察到的情况进行比较。1.1主成分分析主成分分析是将分量相关的原始变量,借助于一个正交变换转化为不相关的

3、新变量,并以方差作为信息量的测度,对新变量进行降维,取累计贡献率大的若干成分作为主成分。这些主成分能够反映原始变量的绝大部分信息,它们通常表示为原始变量的某种线性组合。1.2聚类分析聚类分析是直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类的分析技术。在市场研究领域,聚类分析主要应用方面是帮助我们寻找目标消费群体,运用这项研究技术,我们可以划分出产品的细分市场,并且可以描述出各细分市场的人群特征,以便于客户可以有针对性的对目标消费群体施加影响,合理地开展工作2、数据来源及处理2.1统计思想主成分因子分析的基本思想是通过对变量相关系数矩阵内部结

4、构的研究,找出能控制所以变量的少数几个随机变量去描述多个变量之间的相关关系,并依据相关性的大小将变量分组,使得同组内的变量之间相关性较高,不同组的变量相关性较低。每组代表一个基本结构,这个基本结构成为公共因子。对于所研究的问题试图用最小个数的不可观测的所谓公共因子的线性函数与特殊因子之和来描述原来可观测的每一个变量。下表是要进行处理的31个省市的城镇居民人均消费支出的相关原始数据,数据来源于《2011中国统计年鉴》。X1:食品x2:衣着x3:居住x4:家庭用品x5:交通通信x6:文教娱乐x7:医疗保健表12.2主成分分析表2:因子解释原始变量方差的情况该表显示了各主成分

5、解释原始变量总方差的情况,主成分几乎包含了各个原始变量至少90.517%的信息,可见效果比较好。表3:该表为7个成分的相关系数表4:因子载荷矩阵的成分图该表给出了标准化原始变量用求得的主成分线性表示的近似表达式,用prin1,prin2来表示各个主成分,则有该表可以得:标准化的标准化的标准化的表5:主成分得分表6:因子得分系数矩阵该表由公式所得,显示了各个主成分的因子得分和主成分得分。图1主消费因子F1得分前五名地区依次是上海、广东、浙江、北京、福建,远远高于其他地区,说明上海、广东主要城镇居民人均消费支出远远高于其他地区,与实际情况比较接近。主消费因子F1最后五名地区

6、依次是新疆、河南、青海、甘肃、黑龙江,这些地区经济发展相对落后,人均消费支出低,其主要消费支出也低,但与实际情况还存在差距,贵州城镇居民消费应比黑龙江消费要低,黑龙江不应划为最低人均消费地区。次消费因子F2得分前五名地区依次是北京、内蒙古、吉林、天津、黑龙江;次消费因子F2最后五名地区依次是福建、贵州、广西、西藏、海南,衣着人均消费,在实际消费过程中,人们不容易观察到,这个结论还缺乏一定依据;综合得分F前五名地区依次是上海、北京、广东、浙江、天津;这五个地区经济都发达,人均收入和消费支出都高,将这些地区分为一类比较切合实际。综合得分F最后五名地区依次是新疆、云南、甘肃、

7、贵州、青海,这些地区人口稀少,经济发达相当落后,人民收入和消费水平均处于全国最低水平,与人们观察到的实际情况比较接近,将这些地区分为一类,其他地区则分为另外一类,这样一来就可以将31个省、市、自治区就分为三类,第一类为因子综合得分前五名地区,第三类为因子综合得分最后五名地区,其余地区则划分为第二类。这种分类结果比较切合实际情况。2.3聚类分析表7表8图2结果表明:我国各类地区城镇居民人均消费支出分类效果较好,且不同地区的消费结构有着各自的特点。综合考虑将我国各地区城镇居民人均消费分为四类,较好地反映了人们观察到的实际情况,第一类为上海,2

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。