资源描述:
《主成分分析定义.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、主成分分析定义主成分分析:将原来较多的指标简化为少数几个新的综合指标的多元统计方法。主成分:由原始指标综合形成的几个新指标。依据主成分所含信息量的大小成为第一主成分,第二主成分等等。满足如下的条件:1、每个主成分的系数平方和为1。即血+血•+…+必=12、主成分之间相互独立,即无重叠的信息。即Cov(Fr巧)=0,j,i,J=L2,…,p3、主成分的方差依次递减,重要性依次递减,即Var(F,)>Var(F2)>>Var(Fp)Fl、F2....Fp分别称为原变量的第一、第二….第p个主成分。□例1:设x=(x},x
2、2,x3)的协方差矩阵为:_1-20_工=-250002_从协方差矩阵出发,求解主成分.(1)求协方差矩阵的特征根依据
3、工-加
4、=0求解.1一久-20-25-/10=(1-2)(5-2)(2-A)-(-2)(-2)(2_2)=0002-/1Z=2/I,=5.83^=0.17(2)求特征根对应的特征向量'0.383r0_0.924_u=-0.924u2=0—0.3830.000_10.000(3)主成分:Fi=0.383%!—0.924x2F2=X3F3=0.924尢]+0.383兀2(4)各主成分的贡献率及累计贡献
5、率:第一主成分贡献率:5.83/(5.83+2+0.17)=0.72875第二主成分贡献率:2/(5.83+2+0.17)=0.25第三主成分贡献率:0.17/(5.83+2+0.17)=0.02125第一和第二主成分的累计贡献率:(5.83+2)/(5.83+2+0」7)=0.97875由此可将以前三元的问题降维为两维问题•第一和第二主成分包含了以前变量的绝大部分信息97.875%.样本主成分的性质:1、第K个主成分yk的系数向量是第K个特征根Xk所对应的标准化特征向量。2、第K个主成分的方差为第K个特征根Xk,且
6、任意两个主成分都是不相关的,也就是yl,y2,..・,yp的样本协方差矩阵是对角矩阵3、样本主成分的总方差等于原变量样本的总方差,为p4、第K个样本主成分与第j个变量样本之间的相关系数为:如灯(因子载荷量)ComponentNumber主成分个数的选取1.累积贡献率达到85%以上2.根据特征根的变化来确定&〉无_1P3.作碎石图描述特征值的贡献数据标准化情况下:无二丄=1pi=因子分析的基本理论因子分析是主成分分析的推广,也是利用降维的思想,由研究原始变量相关矩阵或协方差矩阵的内部依赖关系出发,把一些具有错综复杂关
7、系的多个变量归结为少数儿个综合因子的一种多元统计分析因子分析的基本思想:把每个研究变量分解为几个影响因索变量,将每个原始变量分解成两部分因素,一部分是由所有变量共同具有的少数几个公共因子组成的,另一部分是每个变量独自具有的因素,即特殊因子。主成分分析分析与因子分析的联系和差异:因子分析是主成分分析的推广,是主成分分析的逆问题。主成分分析是将原始变量加以综合、归纳;因子分析是将原始变量加以分解、演绎。(1)主成分分析仅仅是变量变换,而因子分析需要构造因子模型。(2)主成分分析:原始变量的线性组合表示新的综合变量,即主成
8、分;因子分析:用潜在的假想变量(公共因子)和随机影响变量(特殊因子)的线性组合表示原始变量。用假设的公因子来“解释讶冃关矩阵内部的依赖关系。(3)主成分分析中主成分个数和变量个数相同,它是将一组具有相关关系的变量变换为一组互不相关的变量,在解决实际问题时,一般取前m个主成分;因子分析的目的是用尽可能少的公因子,以便构造一个结构简单的因子模型。因子分析模型:设x,i=1,2,・・・,#)个变量,如果表示为X,=仏+為+…+ailltFm+&X1%2■■■—角•••+■■■■或X-“=AF+£fludiaPx«12Cl
9、22■■■apiClmCllm•••rir2r3+£i•••Qpmr4£p_称为F、,%,…,化公共因子,是不可观测的变量,他们的系数称为因子载荷。©是特殊因子,是不能被前ni个公共因子包含的部分。其屮:(1)Cov(F,e)=0F,£相互独立即不相关;1(2)D(F)=1.=1■■1MB即耳迅,…,你互不相关,方差为1。&■(3)D(e)=①■■即互不相关,方差不一定相等,©〜N(O,b)。满足以上条件的,称为正交因子模型.如果(2)不成立,即D(F)工I各公共因子之间不独立,则因子分析模型为斜交因子模型.公因子
10、F1公因子F2共同度hi特殊因子&xl=代数10.8960.3410.9190.081%2=代数20.8020.4960.8890.111x3=几何0.5160.8550.9970.003乂4=三角0.8410.4440.9040.096乂5=解析儿何0.8330.4340.8820.118特征值G3.1131.4794.9590.409方差贡