主成分分析与因子分析的异同比较及应用

主成分分析与因子分析的异同比较及应用

ID:12442062

大小:150.50 KB

页数:29页

时间:2018-07-17

主成分分析与因子分析的异同比较及应用_第1页
主成分分析与因子分析的异同比较及应用_第2页
主成分分析与因子分析的异同比较及应用_第3页
主成分分析与因子分析的异同比较及应用_第4页
主成分分析与因子分析的异同比较及应用_第5页
资源描述:

《主成分分析与因子分析的异同比较及应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、主成分分析与因子分析的异同比较及应用·!;·统计教育#$$%年第&期主成分分析与因子分析的异同比较及应用!王芳(南京经济学院经济与统计学院’江苏南京#!$$$%)收稿日期(#$$%)$#)!&作者简介(王芳*!+,-).,女’讲师,主要从事多元统计分析的教学与研究主成分分析是研究如何通过少数几个主成分来解释多变量的方差)协方差结构的分析方法,也就是求出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此不相关。因子分析是研究如何以最少的信息丢失,将众多原始变量浓缩成少数几个因子变量,以及如何使因子变量具有较强的可解释性的一种多元统计分析方法。这两种方法是处理多变量、大样本

2、时经常采用的方法,其二者的最终目的都是降维,而且在处理方法上,许多参考文献上都强调因子分析法是主成分方法的扩展,也就是因子分析的基础是主成分方法,所以对初学者来说,这两种方法在使用时很可能会用混’本文将对两者的异同进行比较。一、基本思想上的异同比较从二者表达的含义上看,主成分分析法和因子分析法都是寻求少数的几个变量(或因子)来综合反映全部变量(因子)的大部分信息,变量虽然较原始变量少,但所包含的信息量却占原始信息的/&0以上,用这些新变量来分析经济问题,其可信度仍然很高,而且这些新的变量彼此间互不相关,消除了多重共线性。对新变量的认识,不能错误简单地认为所寻求来的这几个少数变量(因子)

3、是原始变量经过筛选后剩余的变量,我们要清楚地认识到,对通过主成分分析所得来的新变量是原始变量的线性组合,如原始变量为1!’1#’222’13’经过坐标变换,将原有的3个相关变量14作线性变换,转换成另一组不相关的变量54’我们可以得到一组表达式(5!67!!1!87!#1#8···87!3135#67#!1!87##1#8···87#313···53673!1!873#1#8···87331??????????3每个主成分都是由原有3个变量线性组合得到’矩阵9满足9:96!的条件,在诸多主成分54中,5!在总方差中占的比重最大,说明它综合原有变量1!’1#’222’13的能力最强,其余主成分5

4、#’5%,222’53在总方差中占的比重依次递减,说明越往后的主成分综合原信息的能力越弱。以后的分析可以用前面几个方差最大的主成分5来进行,一般情况下,要求前几个54*4;3.所包含的信息不少于原始信息的/&0,这样既减少了变量的数目,又能够用较少的主成分反映原有变量的绝大部分信息。如利用主成分来消除多元回归方程的多重共线性,利用主成分来筛选多元线性回归方程中的变量等。通过因子分析得来的新变量是对每一个原始变摘要(主成分分析法和因子分析法都是从变量的方差)协方差结构入手,在尽可能多地保留原始信息的基础上,用少数新变量来解释原始变量的多元统计分析方法。教学实践中’发现学生运用主成分分析法

5、和因子分析法处理降维问题的认识不够清楚,本文针对性地从主成分分析法、因子分析法的基本思想、使用方法及统计量的分析等多角度进行比较,并辅以实例。关键词(主成分分析<因子分析<比较<应用中图分类号:=/!文献标识码:>文章编号:!$$&)&,-#(#$$%)$&)$$$!;)$;总第!;期·#!·量进行内部剖析,打比喻来说,原始变量就如成千上万的糕点,每一种糕点的原料都有面粉、油、糖及相应的不同原料,这其中,面粉、油、糖是所有糕点的共同材料,正如因子分析中的新变量即因子变量$正确选择因子变量后,如果想考虑成千上万糕点的物价变动,只需重点考虑面粉、油、

6、糖等公共因子的物价变动即可。所以因子分析不是对原始变量的重新组合,而是对原始变量进行分解,分解为公共因子与特殊因子两部分。即因子分析就是要利用少数几个公共因子去解释较多个要观测变量中存在的复杂关系,它把原始变量分解为两部分因素,一部分是由所有变量共同具有的少数几个公共因子构成的,另一部分是每个原始变量独自具有的因素,即特殊因子。对新产生的主成分变量及因子变量计算其得分,就可以将主成分得分或因子得分代替原始变量进行下一步的分析,因为主成分变量及因子变量比原始变量少了许多,所以起到了降维的作用,为我们处理数据降低了难度。二、数据标准化的异同比较主成分分析中为了消除量纲和数量级,通常需要将原始数据进

7、行标准化,将其转化为均值为%方差为#的无量纲数据。而因子分析在这方面要求不是太高,因为在因子分析中可以通过主因子法、加权最小二乘法、不加权最小二乘法、重心法等很多解法来求因子变量,并且因子变量是每一个变量的内部影响变量,它的求解与原始变量是否同量纲关系并不太大,当然在采用主成分法求因子变量时,仍需标准化。不过在实际应用的过程中,为了尽量避免量纲或数量级的影响,建议在使用因子分析前还是要进行数据标准

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。