资源描述:
《多元统计分析-因子分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、多元统计分析-因子分析2021/7/2412021/7/242多元统计分析(简称多元分析)是运用数理统计的方法研究多变量(多指标)问题的理论和方法,是一元统计学的推广。2021/7/243因子分析的提出为尽可能完整描述一个事物,往往要收集它的许多指标多指标产生的问题:计算处理麻烦信息重叠从众多的指标中剔除一些指标又会造成信息丢失2021/7/244因子分析是研究如何以最少的信息丢失将众多原有变量浓缩成少数几个因子,如何使因子具有一定的命名解释性的多元统计分析方法.其核心是用较少的相互独立的因子反映原有变量的绝大部分信息.
2、2021/7/245因子分析的基本思想因子分析的基本出发点将原始指标综合成较少的指标,这些指标能够反映原始指标的绝大部分信息(方差是各变量值与其均值离差平方的平均数,是测度数值型数据离散程度的主要指标.)这些综合指标之间没有相关性2021/7/246因子分析的基本思想因子变量的特点这些综合指标称为因子变量,是原变量的重造个数远远少于原变量个数,但可反映原变量的绝大部分方差不相关性可命名解释性2021/7/247因子分析的基本步骤确认待分析的原始变量是否适合作因子分析构造因子变量利用旋转方法使因子变量具有可解释性计算每个样
3、本的因子变量得分2021/7/248因子分析的数学模型数学模型(xi为标准化的原始变量;Fi为因子变量;k
4、ity)hi变量的共同度hi也称公共方差。Xi的变量共同度为因子载荷矩阵A中第i行元素的平方和可见:Xi的共同度反应了全部因子变量对Xi总方差的解释能力2021/7/2411可见:Xi的共同度反应了全部因子变量对Xi总方差的解释能力2021/7/2412因子分析的相关概念因子变量Fj的方差贡献SJ因子变量Fj的方差贡献SJ为因子载荷矩阵A中第j列各元素的平方和可见:因子变量Fj的方差贡献体现了同一因子Fj对原始所有变量总方差的解释能力Sj/p表示了第j个因子解释原所有变量总方差的比例2021/7/2413检验原有变量是否
5、适合作因子分析计算原有变量的相关系数矩阵一般小于0.3就不适合作因子分析计算KMO检验统计量是用于比较简单相关系数和偏相关系数的指标.取值在0-1之间.KMO越接近1,意味着变量间的相关性越强,原有变量越适合做因子分析.0.9以上表示非常适合,0.8表示适合,0.7表示一般,0.6以下表示不适合.2021/7/2414计算巴特利特球形检验统计量以原有变量的相关系数矩阵为出发点。其零假设是H0是:相关系数矩阵是单位矩阵。巴特利特球形检验的检验统计量根据相关系数矩阵的行列式计算得到,且近似服从卡方发布。如果该统计量的观测量比
6、较大,且对应的概率p值小于给定的显著性水平α,则应拒绝零假设,认为相关系数矩阵不太可能是单位矩阵,原有变量适合作因子分析。反之,原有变量不适合作因子分析。原有变量是否适合作因子分析2021/7/2415确定因子变量--主成份分析主成份分析法的数学模型:该方程组要求:将原有的P个相关变量Xi作线性变换后转成另一组不相关的变量Yi2021/7/2416确定因子变量--主成分分析系数uij依照两个原则来确定yi与yj(i≠j,i,j=1,2,3,…p)互不相关;y1是x1,x2,x3,…,xp的一切线性组合(系数满足上述方程组
7、)中方差最大的;y2是与y1不相关的x1,x2,x3,…,xp的一切线性组合中方差次大的;yP是与y1,y2,y3,…yp都不相关的x1,x2,x3,…,xp的一切线性组合中方差最小的;y1在总方差中所占比例最大,它综合原有变量的能力最强,其余变量在总方差中所占比例依次递减,即:其余变量综合原有变量的能力依次减弱。2021/7/2417确定因子变量--主成分分析2021/7/2418确定因子变量--主成份分析主成份分析的基本步骤:将原始数据标准化计算变量间简单相关系数矩阵R求R的特征值λ1≥λ2≥λ3≥…λp≥0及对应的
8、单位特征向量μ1,μ2,μ3,…μp得到:yi=u1ix1+u2ix2+…+upixp2021/7/24192021/7/2420确定因子变量个数确定k个因子变量根据特征值λi确定:取特征值大于1的特征根根据累计贡献率:一般累计贡献率应在70%以上。2021/7/2421确定因子变量个数确定k个因子变量通过观察碎石图