欢迎来到天天文库
浏览记录
ID:59444982
大小:67.50 KB
页数:32页
时间:2020-09-17
《主成分分析和因子分析ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第十四章主成分分析和因子分析一、主成分分析1、概述主成分分析只是一种中间手段,其背景是研究中经常会遇到多指标的问题,这些指标间往往存在一定的相关,直接纳入分析不仅复杂,变量间难以取舍,而且可能因多元共线性而无法得出正确结论。主成分分析的目的就是通过线性变换,将原来的多个指标组合成相互独立的少数几个能充分反映总体信息的指标,便于进一步分析。在主成分分析中,提取出的每个主成分都是原来多个指标的线性组合如有两个原始变量x1和x2,则一共可提取出两个主成分如下:z1=b11x1+b21x2z2=b12x1+b22x
2、2原则上如果有n个变量,则最多可以提取出n个主成分,但如果将它们全部提取出来就失去了该方法简化数据的实际意义。多数情况下提取出前2~3个主成分已包含了80%以上的信息,其他的可以忽略不计。提取出的主成分能包含主要信息即可,不一定非要有准确的实际含义。主成分在几何图形中的方向实际上就是相关矩阵R的特征向量的方向,主成分的方差贡献率等于R的相应特征值,因此,求主成分的过程实际上就是求相关矩阵R的特征值和特征向量的过程。2、主成分模型中各统计量的意义:特征根:可看成主成分影响力度的指标。一般用特征根大于1作为纳入
3、标准;主成分的方差贡献率:表明主成分的方差在全部方差中的比重;累积贡献率:表明前K个主成分累计提取了原来所有变量的多少信息。3、主成分分析的步骤:对原来的P个指标进行标准化,以消除变量在数量级或量纲上的影响;根据标准化后的数据矩阵求出协方差或相关阵;求出协方差矩阵的特征根或特征向量;确定主成分,结合专业知识给个主成分所蕴涵的信息给予适当的解释。4、主成分的应用:降低所研究的数据空间的维数,低维空间代替高维空间时所损失的信息很少;因子负荷的结构有助于弄清x变量间的某些关系;多维数据的一种图形表示方法。由图形可
4、直观地看出各样品在主成分中的地位,进而还可以对样品进行分类处理;由主成分分析法构造回归模型,即把各主成分作为新的自变量代替原来的自变量x做回归分析;用主成分分析筛选回归变量。二、因子分析1、概述因子分析是一种多变量化简技术。目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的指标归为一类,不同类间变量的相关性较低。每一类变量代表了一个“共同因子”,即一种内在结构,因子分析就是要寻找该结构。比如在市场调查中收集了食品的五项指标:味道、价格、风味、是否快餐食品、能量。经过因子分析后发现结果如下:x1=0.
5、02z1+0.99z2+ε1x2=0.94z1-0.01z2+ε2x3=0.13z1+0.98z2+ε3x4=0.84z1+0.42z2+ε4x5=0.97z1-0.02z2+ε5第一公因子主要影响价格、是否快餐食品和能量,代表“价廉”第二公因子则主要影响味道和风味,代表“味美”ε代表特殊因子,只对当前变量有影响,表示该变量中独特的,不能被公因子所解释的特征2、有关概念因子负荷(因子载荷):即表达式中各因子的系数值,用于反映因子和各个变量间的密切程度,其实质是两者间的相关系数。特征根(Eigenvalue)
6、:反映了原始变量的总方差在各成分上的重新分配,可以被看成是因子/主成分影响力度的指标,代表引入该因子/主成分后可以解释平均多少原始变量的信息。变量共同度(公共方差):原有变量Xi的共同度定义为因子载荷矩阵A中第i行元素的平方和,反映了全部公共因子变量对原有变量Xi总方差解释说明的比例。共同度越接近1,公共因子解释原有变量Xi的效果越好。公共因子Fj的方差贡献:定义为因子载荷矩阵A中第j列各元素的平方和,反映了因子Fj对所有原始变量的解释能力,其值越高,该因子的重要程度越高。3、方法用途研究设计阶段/问卷效果
7、评估阶段评价问卷的结构效度统计分析阶段寻找变量间潜在结构内在结构证实4、适用条件样本量样本量与变量数的比例应在5:1以上总样本量不得少于100,而且原则上越大越好各变量间必须有相关性KMO(Kaiser-Meyer-Olkin)检验KMO统计量:用来比较简单相关系数和偏相关系数的一个指标,当所有变量间的简单相关系数平方和远远大于偏相关系数平方和时,KMO接近1。KMO度量标准:0.9最佳,0.8适合,0.7尚可,0.6很差,0.5以下放弃Bartlett’s球形检验(Bartletttestofspheri
8、city)Bartlett’s球形检验以变量的相关系数矩阵为出发点。它的零假设是:相关系数矩阵是一个单位阵。检验统计量根据相关系数矩阵的行列式计算得到。该统计量值较大时,对应的伴随概率小于设定的显著性水平,则应拒绝零假设,认为相关系数矩阵不是单位阵,适合做因子分析;反之相反。5、标准分析步骤:判断是否需要进行因子分析,数据是否符合要求进行分析,按一定标准确定提取的因子数目如果进行的是因子分析,则考察因子的可解释性
此文档下载收益归作者所有