多元统计分析报告.doc

多元统计分析报告.doc

ID:6462893

大小:298.07 KB

页数:17页

时间:2018-01-14

多元统计分析报告.doc_第1页
多元统计分析报告.doc_第2页
多元统计分析报告.doc_第3页
多元统计分析报告.doc_第4页
多元统计分析报告.doc_第5页
资源描述:

《多元统计分析报告.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、多元统计分析报告——按收入等级分家庭平均每人全年购买力差异1、问题背景:1.1数据来源:数据完全来源于《中国统计年鉴》2010年的数据统计,原统计数据总共统计2010年各个等级家庭平均购买的物品有17种,考虑到自身对多元统计的不娴熟,因此只节选了其中的12种。1.2问题背景:近10年来,随着中国经济的飞速发展,城镇居民的贫富差距也在日益的增加。本文通过2010年居民购买普通消费品数量差距的统计数据,针对我国8中不同收入等级的居民家庭做了多元统计分析。根据此分析,可以看出家庭收入水平对日常消费品购买力的各种影响,并且可以看

2、出各个收入等级的消费水平以及全民平均水平。针对其结果分析,结合实际对我国的日常消费品在价格方面做出合理的建议,为经济市场的优化完善略尽薄力。2、分析方法介绍:2.1因子分析因子分析模型是主成分分析的推广。它也是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。相对于主成分分析,因子分析更倾向于描述原始变量之间的相关关系;因此,因子分析的出发点是原始变量的相关剧增。因子分析的思想始于1904年查尔斯·斯皮尔曼对学生考试成绩的研究。2.1.1

3、因子分析思想因子分析思想是把联系较为紧密的变量归为同一个类别,而不同类别的变量之间的相关性则较低。在同一个类别内的变量,可以想象是受到了某个共同因素的影响才彼此高度相关的,这个共同因素也称之为公共因子,它是潜在的并且是不可观测的。因子分析反映了一种降维的思想,通过降维将相关性高的变量聚在一起,不仅便于提取容易解释的特征,而且降低了需要分析的变量数目和问题分析的复杂性。2.1.2因子分析模型一般因子分析模型:设有n个样品,每个样品观察p个指标,这p个指标之间有较强的相关性(要求p个指标相关性较强的理由是很明确的,只有相关性

4、较强才能从原始变量中提取出“公共”因子)。为了便于研究,并消除由于观测量纲的差异及数量级不同所造成的影响,将样本观测数据进行标准化处理,使标准化后的变量均值为0,方差为1。2.1.3因子分析步骤A)确定因子载荷:主成分法、主轴因子法、最小二乘法、极大似然法、α因子提取法等。由于这些方法求解因子载荷的出发点不同,所得的结果也不完全相同,为此我们就本论文所用到的主成分法寻找公共因子的方法做详细介绍。主成分寻找公共因子的方法如下:假定从相关阵出发求解主成分没有p个变量,则我们可以找出p个主成分。将所得的p个主成分按由大到小的顺

5、序排列,记为Y1,Y2,...,YP,则主成分与原始变量之间存在如下关系式:{(1)式中,为随机向量X的相关矩阵的特征值所对应的特征向量的分量,因为特征向量之间彼此正交,从X到Y的转换关系是可逆的,很容易得出由Y到X的转换关系为:{(2)我们对上面每一等式只保留前m个主成分而把后面的部分用代替,则⑵式可变为:这个式子在形式上已经与因子模型相一致,且之间相互独立,为了把Yi转化成合适的公因子,现在要做的工作只是把主成分Yi变为方差为1的变量。为完成此变换,必须将Yi除以其标准差(即为特征根的平方根。于是,令:,则⑶式变为:

6、这与因子模型完全一致,这样,就得到了载荷A矩阵和一组初始公因子(未旋转)。B)因子旋转:因子旋转分为正交旋转与斜交旋转,正交旋转由初始载荷矩阵A左乘一正交阵而得到。经过正交旋转而得到的新的公因子仍然保持彼此独立的性质。而斜交旋转则放弃了因子之间彼此独立这个限制,因而可能达到更为简洁的形式,其实际意义也更容易解释。但不论是正交旋转还是斜交旋转,都应当使新的因子载荷系数要么尽可能地接近与零,要么尽可能地远离零。C)因子得分:因子得分就是公共因子在每一个样品点上的得分。根据因子得分我们可以知道那个城市的经济发展水平要高,那个城

7、市的经济发展水平要底。2.2聚类分析SAS软件中用于聚类分析的过程主要有以下三个:PROCCLUSTER系统聚类(Q型聚类分析),适用于对观测值或样品聚类;PROCFASTCLUS逐步聚类(Q型聚类分析),适用于大样本聚类;PROCVARCLUS变量聚类(R型聚类分析),适用于对变量或指标聚类。系统聚类法是聚类分析中采用最多的聚类方法,本次论文则主要运用这种聚类分析法。1、SAS程序:3.1变量设定及其数据录入总平均数最低收入户困难户低收入户中等偏下收入中等收入户中等偏上收入高收入户最高收入户YX1X2X3X4X5X6X

8、7X8其中,Y为因变量,Xi(i=1,2...8)为自变量。3.2录入数据程序编辑首先打开SAS软件,并编辑内容如下:datafit;title'userincomelevelofpurchasingpowerdifferences';InputYX1X2X3X4X5X6X7X8@@;cards;20.7314.98

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。