资源描述:
《多元统计分析重点.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、多元统计分析重点宿舍版第一讲:多元统计方法及应用;多元统计方法分类(按变量、模型、因变量等)多元统计分析应用选择题:①数据或结构性简化运用的方法有:多元回归分析,聚类分析,主成分分析,因子分析②分类和组合运用的方法有:判别分析,聚类分析,主成分分析③变量之间的相关关系运用的方法有:多元回归,主成分分析,因子分析,④预测与决策运用的方法有:多元回归,判别分析,聚类分析因果模型(因变量数):多元回归,判别分析⑤横贯数据:{相依模型(变量测度):因子分析,聚类分析多元统计分析方法选择题:①多元统计方法的分类:1)按测量数据的来源分
2、为:横贯数据(同一时间不同案例的观测数据),纵观数据(同样案例在不同时间的多次观测数据)2)按变量的测度等级(数据类型)分为:类别(非测量型)变量,数值型(测量型)变量3)按分析模型的属性分为:因果模型,相依模型4)按模型中因变量的数量分为:单因变量模型,多因变量模型,多层因果模型第二讲:计算均值、协差阵、相关阵;相互独立性第三讲:主成分定义、应用及基本思想,主成分性质,主成分分析步骤主成分定义:何谓主成分分析就是将原来的多个指标(变量)线性组合成几个新的相互无关的综合指标(主成分),并使新的综合指标尽可能多地反映原来的指标
3、信息。主成分分析的应用:(1)数据的压缩、结构的简化;(2)样品的综合评价,排序主成分分析概述——思想:①(1)把给定的一组变量X1,X2,…XP,通过线性变换,转换为一组不相关的变量Y1,Y2,…YP。(2)在这种变换中,保持变量的总方差(X1,X2,…Xp的方差之和)不变,同时,使Y1具有最大方差,称为第一主成分;Y2具有次大方差,称为第二主成分。依次类推,原来有P个变量,就可以转换出P个主成分(3)在实际应用中,为了简化问题,通常找能够反映原来P个变量的绝大部分方差的q(q
4、的协方差矩阵是对角阵:(2)性质2:主成分的总方差等于原始变量的总方差(3)性质3:主成分Yk与原始变量Xi的相关系数为:ρ√k(YK,Xi)=tki,并称之为因子负荷量(或因子载荷量)。√σii主成分分析的具体步骤:①将原始数据标准化;②建立变量的相关系数阵;③求的特征根为*L*0,相应的特征向量为T*,T*,L,T*;④由累积方差贡献率确1p12p定主成分的个数(m),并写出主成分为Y(T*)X*,i1,2,L,mii第四讲:因子分析定义,因子载荷统计意义,因子分析模型及假设,因子旋转因子分析定义:因子
5、分析就是通过对多个变量的相关系数矩阵的研究,找出同时影响或支配所有变量的共性因子的多元统计方法。因子载荷统计意义:a1.因子载荷ij的统计意义对于因子模型XaFaFLaFLaFi1,2,L,pii11i22ijjimmiXF我们可以得到,i与j的协方差为:mCov(X,F)Cov(aF,F)ijikkijk1mCov(aF,F)Cov(,F)ikkjij=k1a=ijXXF如果对i作了标准化处理,i的标准差为1,且j的标准差为1,因此Cov(X,F)rijCov(X,F)aXi,Fj
6、D(X)D(F)ijijij(7.6)XaXF那么,从上面的分析,我们知道对于标准化后的i,ij是i与j的相关系数,它XF一方面表示i对j的依赖程度,绝对值越大,密切程度越高;另一方面也反映了XF变量i对公共因子j的相对重要性。了解这一点对我们理解抽象的因子含义有非常重要的作用。h22.变量共同度i的统计意义设因子载荷矩阵为A,称第i行元素的平方和,即mh2a2i1,2,L,piijj1(7.7)X为变量i的共同度。由因子模型,知D(X)a2D(F)a2D(F)La2D(F)D()ii11i22immi
7、a2a2La2D()i1i2imih22ii(7.8)Xh2这里应该注意,(7.8)式说明变量i的方差由两部分组成:第一部分为共同度i,XX它描述了全部公共因子对变量i的总方差所作的贡献,反映了公共因子对变量iX的影响程度。第二部分为特殊因子i对变量i的方差的贡献,通常称为个性方差。X如果对i作了标准化处理,有1h22ii(7.9)Fg23、公因子j的方差贡献j的统计意义j设因子载荷矩阵为A,称第列元素的平方和,即pg2a2j1,2,L,mjiji1Fg2F为公共因子j对X的贡献,即j表示同一
8、公共因子j对各变量所提供的方差贡献之总和,它是衡量每一个公共因子相对重要性的一个尺度。因子分析模型及假设数学模型:每一个变量都可以表示成公共因子的线性函数与特殊因子之和,即:Xi=ai1*F1+a12*F2+…+aim*Fm+εi(i=1,2,…,p)式中的F1,F2,…Fm称为公共因子,