多元统计分析整理版.doc

多元统计分析整理版.doc

ID:46809295

大小:376.59 KB

页数:15页

时间:2019-11-28

多元统计分析整理版.doc_第1页
多元统计分析整理版.doc_第2页
多元统计分析整理版.doc_第3页
多元统计分析整理版.doc_第4页
多元统计分析整理版.doc_第5页
资源描述:

《多元统计分析整理版.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、1、主成分分析的目的是什么?主成分分析是考虑各指标间的相互关系,利用降维的思想把多个指标转换成较少的几个相互独立的、能够解释原始变量绝大部分信息的综合指标,从而使进一步研究变得简单的一种统计方法。它的目的是希望用较少的变量去解释原始资料的大部分变异,即数据压缩,数据的解释。常被用来寻找判断事物或现象的综合指标,并对综合指标所包含的信息进行适当的解释。2、主成分分析基本思想?主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标。同时根据实际需要从中选取几个较少的综合指标尽可能多地反映原来的指标的信息。l设p个原始变量为,新的变量(即主成分)为,主成分和原始变量之

2、间的关系表示为?3、在进行主成分分析时是否要对原来的p个指标进行标准化?SPSS软件是否能对数据自动进行标准化?标准化的目的是什么?需要进行标准化,因为因素之间的数值或者数量级存在较大差距,导致较小的数被淹没,导致主成分偏差较大,所以要进行数据标准化;进行主成分分析时SPSS可以自动进行标准化;标准化的目的是消除变量在水平和量纲上的差异造成的影响。求解步骤n对原来的p个指标进行标准化,以消除变量在水平和量纲上的影响n根据标准化后的数据矩阵求出相关系数矩阵n求出协方差矩阵的特征根和特征向量n确定主成分,并对各主成分所包含的信息给予适当的解释版本二:根据我国31个省市自治区2006年的6项主要

3、经济指标数据,表二至表五,是SPSS的输出表,试解释从每张表可以得出哪些结论,进行主成分分析,找出主成分并进行适当的解释:(下面是SPSS的输出结果,请根据结果写出结论)表一:数据输入界面表二:数据输出界面a)此表为相关系数矩阵,表示的是各个变量之间的相关关系,说明变量之间存在较强的相关系数,适合做主成分分析。观察各相关系数,若相关矩阵中的大部分相关系数小于0.3,则不适合作因子分析。表三为各成分的总解释方差表。component为各成分的序号;initialEigenvalues是初始特征值,total是各成分的特征值,%ofvariance是各成分的方差占总方差的百分比(贡献率)。Cu

4、mulative%是累计贡献率,表明前几个成分可以解释总方差的百分数。Extractionsums是因子提取结果。一般来说,当特征根需大于1,主成分的累计方差贡献率达到80%以上的前几个主成分,都可以选作最后的主成分。由表可知,第一个主成分的特征根为3.963,方差贡献率为66.052%,这表示第一个主成分解释了原始6个变量66.052%的信息,可以看出前两个成分所解释的方差占总方差的95.57%,仅丢失了4.43%的信息。因此最后结果是提取两个主成分。在extractionsumsofsquaredloadings一栏,自动提取了前两个公因子,因为前两个公因子就可以解释总方差的绝大部分9

5、5.6%。表四是表示各成分特征值的碎石图。可以看出因子1与因子2,以及因子2与因子3之间的特征值之差值比较大。而因子3、4、5之间的特征值差值都比较小,可以初步得出保留两个因子将能概括绝大部分信息。明显的拐点为3,因此提取2个因子比较合适。证实了表三中的结果。碎石图(ScreePlot),从碎石图可以看到6个主轴长度变化的趋势。实践中,通常选择碎石图中变化趋势出现拐点的前几个主成分作为原先变量的代表,该例中选择前两个主成分即可。表五是初始提取的成分矩阵,它显示了原始变量与各主成分之间的相关系数,表中的每一列表示一个主成分作为原来变量线性组合的系数,也就是主成分分析模型中的系数aij。比如,

6、第一主成分所在列的系数0.670表示第1个主成分和原来的第一个变量(人均GDP)之间的线性相关系数。这个系数越大,说明主成分对该变量的代表性就越大。第一主成分(component1)对财政收入,固定资产投资,社会消费品零售总额有绝对值较大的相关系数;第二主成分(component2)对人均gdp,年末总人口,居民消费水平有绝对值较大的相关系数。可以分别对其进行命名。版本一:根据我国31个省市自治区2006年的6项主要经济指标数据,进行因子分析,对因子进行命名和解释,并计算因子得分和排序。表一数据输入界面:表二因子分析SPSS输出界面a)KMO统计量为0.695,接近0.7,表明6个变量之间

7、有较强的相关关系。适合作因子分析。Bartlett球度检验统计量为277.025。检验的P值接近0,拒绝原假设,认为相关系数与单位阵有显著差异。可以因子分析。表三因子分析SPSS输出界面b)表三为公因子提取前和提取后的共同度表,initial列提取因子前的各变量的共同度;extraction列是按特定条件(如特征值>1)提取公因子时的共同度,表中的共同度都很高,说明提取的成分能很好的描述这些变量。所有变量的共同度量都在8

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。