因子分析.ppt.convertor

因子分析.ppt.convertor

ID:14170790

大小:42.50 KB

页数:5页

时间:2018-07-26

因子分析.ppt.convertor_第1页
因子分析.ppt.convertor_第2页
因子分析.ppt.convertor_第3页
因子分析.ppt.convertor_第4页
因子分析.ppt.convertor_第5页
资源描述:

《因子分析.ppt.convertor》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第十章SPSS因子分析本章内容10.1因子分析概述10.2因子分析的基本内容10.3因子分析的基本操作及案例10.1因子分析概述10.1.1因子分析的意义在实际问题的分析过程中,人们往往希望尽可能多的搜集关于分析对象的数据信息,进而能够比较全面的、完整的把握和认识它。于是,对研究对象的描述就会有很多指标。但是效果如何呢?如果搜集的变量过多,虽然能够比较全面精确的描述事物,但在实际建模时这些变量会给统计分析带来计算量大和信息重叠的问题。而消减变量个数必然会导致信息丢失和信息不完整等问题的产生。因子分析是解决上述问题的一种非常有效的方法。

2、它以最少的信息丢失,将原始众多变量综合成较少的几个综合指标(因子),能够起到有效降维的目的。因子分析的特点1、因子个数远远少于原有变量的个数;2、因子能够反应原有变量的绝大部分信息;3、因子之间不存在线性关系;4、因子具有命名解释性。10.1.2因子分析的数学模型和相关概念数学模型假设原有变量有p个,分别用表示,且每个变量的均值是0,标准差是1,现将每个原有变量用k(k

3、载荷矩阵,称为因子载荷,是第i个原始变量在第j个因子上的负荷;称为特殊因子,表示原始变量不能被因子解释的部分。其均值为0,相当于多元线性回归模型中的残差。因子分析的几个相关概念1、因子载荷在因子不相关的前提下,因子载荷是第i个变量与第j个因子的相关系数。因子载荷越大说明因子与变量的相关性越强,所以因子载荷说明了因子对变量的重要作用和程度。2、变量共同度变量共同度也称为公共方差。第i个变量的共同度定义为因子载荷矩阵中第i行元素的平方和,即:3、因子的方差贡献因子方差贡献是因子载荷矩阵中第j列元素的平方和,反映了第j个因子对原有变量总方差

4、的解释能力。该数值越高,说明相应因子的重要性越高。10.2因子分析的基本内容10.2.1因子分析的基本步骤1、因子分析的前提条件;因子分析的前提条件是原始变量之间应存在较强的相关关系。2、因子提取;3、使因子更具有命名可解释性;4、计算各样本的因子得分。10.2.2因子分析的前提条件1、计算相关系数并进行统计检验如果相关系数矩阵中的大部分相关系数小于0.3,那么这些变量不适合进行因子分析。2、计算反映象相关矩阵3、Bartlett’s球度检验以原有变量的相关系数矩阵为出发点,假设相关系数为单位矩阵,如果该检验对应的P值小于给定的显著性

5、水平a,则应拒绝原假设,认为原有变量适合进行因子分析。4、KMO检验该统计量取值在0-1之间,越接近于1说明变量间的相关性越强,原有变量适合做因子分析。0.9以上表示非常合适;0.8-0.9表示合适;0.7-0.8表示一般;0.6-0.7表示尚可;0.5-0.6表示不太合适;0.5以下表示极不合适。10.2.3因子提取和因子载荷矩阵的求解因子载荷矩阵的求解一般采用主成分法。主成份分析法通过坐标变换的手段,将原有的p个变量标准化后进行线性组合,转换成另一组不相关的变量y,即:式中的系数按以下原则进行求解:(1)(2)根据以上原则确定的变

6、量依次为原始变量的第1、第2…第p个主成分。其中第一个主成分在总方差中所占比例最大,其余主成分在总方差中所占比例依次递减,即主成分综合原始变量的能力依次减弱。在主成份的实际应用中,一般只选取前面几个主成分即可,这样既减少了变量的数目,又能够用较少的主成分反映原始变量的绝大部分信息。可见,主成分分析关键的步骤是如何求出上述方程中的系数。通过方程的推导可以发现,每个方程中的系数向量是原始变量相关系数矩阵的特征值对应的特征向量。具体求解步骤如下:(1)将原有变量进行标准化处理;(2)计算变量的相关系数矩阵;(3)求相关系数矩阵的的特征根及对

7、应的特征向量因子分析利用主成分分析得到的p个特征根和对应的特征向量,在此基础上计算因子载荷矩阵:由于因子分析的目的是减少变量个数,因此在计算因子载荷矩阵时,一般不选取所有特征值,而只选取前k个特征值和特征向量,得到下面包含k个因子的因子载荷矩阵:因子个数的确定方法:(1)根据特征根确定因子数:一般选取大于1的特征根,还可规定特征根数与特征根值的碎石图并通过观察碎石图确定因子数;(2)根据因子的累计方差贡献率确定因子数:通常选取累计方差贡献率大于85%的特征根个数为因子个数。例:成绩数据(student.sav)100个学生的数学、物理

8、、化学、语文、历史、英语的成绩如下表(部分)。从本例可能提出的问题能不能把这个数据的6个变量用一两个综合变量来表示呢?这一两个综合变量包含有多少原来的信息呢?能不能利用找到的综合变量来对学生排序呢?这一类数据所涉及的问题

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。