资源描述:
《数学建模多元统计分析报告.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、实验报告一、实验名称多元统计分析作业题。二、实验目的(一)了解并掌握主成分分析与因子分析的基本原理和简单解法。(二)学会使用matlab编写程序进行因子分析,求得特征值、特征向量、载荷矩阵等值。(三)学会使用排序、元胞数组、图像表示最后的结果,使结果更加直观。三、实验容与要求四、实验原理与步骤(一)第一题:1、实验原理:因子分析简介:(1)1.1基本因子分析模型设p维总体x=(x1,x2,....,xp)'的均值为u=(u1,u2,....,u3)',因子分析的一般模型为x1=u1+a11f1+a12f2+........+a1mfm+ε1x2=u2+a21f1+a22f2+.....
2、...+a2mfm+ε2 ......... xp=up+ap1f1+fp2f2+..........+apmfm+εp其中,f1,f2,.....,fm为m个公共因子;εi是变量xi(i=1,2,.....,p)所独有的特殊因子,他们都是不可观测的隐变量。称aij(i=1,2,.....,p;j=1,2,.....,m)为变量xi的公共因子fi上的载荷,它反映了公共因子对变量的重要程度,对解释公共因子具有重要的作用。上式可以写为矩阵形式 x=u+Af+ε其中A=(aij)pxm称为因子载荷矩阵;f=(f1,f2,....,fm)'为公共因
3、子向量;ε=(ε1,ε2,.....εp)称为特殊因子向量(1)1.2共性方差与特殊方差 xi的方差var(xi)由两部分组成,一个是公共因子对xi方差的贡献,称为共性方差;一个是特殊因子对xi方差的贡献,称为特殊方差。每个原始变量的方差都被分成了共性方差和特殊方差两部分。(2)1.3因子旋转因子分析的主要目的是对公共因子给出符合实际意义的合理解释,解释的依据就是因子载荷阵的个列元素的取值。当因子载荷阵某一列上各元素的绝对值差距较大时,并且绝对值大的元素较少时,则该公共因子就易于解释,反之,公共因子的解释就比较困难。此时可以考虑对因子和因子载荷进行旋转(例如正交旋转),使得旋转后的因子
4、载荷阵的各列元素的绝对值尽可能量两极分化,这样就使得因子的解释变得容易。 因子旋转方法有正交旋转和斜交旋转两种,这里只介绍一种普遍使用的正交旋转法:最大方差旋转。这种旋转方法的目的是使因子载荷阵每列上的各元素的绝对值(或平方值)尽可能地向两极分化,即少数元素的绝对值(或平方值)取尽可能大的值,而其他元素尽量接近于0.(3)1.4因子得分 在对公共因子做出合理解释后,有时还需要求出各观测所对应的各个公共因子的得分,就比如我们知道某个女孩是一个美女,可能很多人更关心该给她的脸蛋、身材等各打多少分,常用的求因子得分的方法有加权最小二乘法和回归法。 注意:因子载荷矩阵和得分矩阵的区别:因子载荷
5、矩阵是各个原始变量的因子表达式的系数,表达提取的公因子对原始变量的影响程度。因子得分矩阵表示各项指标变量与提取的公因子之间的关系,在某一公因子上得分高,表明该指标与该公因子之间关系越密切。简单说,通过因子载荷矩阵可以得到原始指标变量的线性组合,如X1=a11*F1+a12*F2+a13*F3,其中X1为指标变量1,a11、a12、a13分别为与变量X1在同一行的因子载荷,F1、F2、F3分别为提取的公因子;通过因子得分矩阵可以得到公因子的线性组合,如F1=a11*X1+a21*X2+a31*X3,字母代表的意义同上。 (4)1.5因子分析中的Heywood(海伍德)现象 如果x的各个
6、分量都已经标准化了,则其方差=1。即共性方差与特殊方差的和为1。也就是说共性方差与特殊方差均大于0,并且小于1。但在实际进行参数估计的时候,共性方差的估计可能会等于或超过1,如果等于1,就称之为海伍德现象,如果超过1,称之为超海伍德线性。超海伍德现象意味着某些特殊因子的方差为负,表明肯定存在问题。造成这种现象的可能原因包括: 共性方差本身估计的问题;太多的共性因子,出现了过拟合;太少的共性因子,造成拟合不足;数据太少,不能提供稳定的估计; 因子模型不适合这些数据。 当出现海伍德现象或超海伍德现象时,应对估计结果保持谨慎态度。可以尝试增加数据量,或改变公共因子数目,让公共因子数目在一个允
7、许的围变动,观察估计结果是否有改观;还可以尝试用其他多元统计方法进行分析,比如主成分析。2、实验步骤:(1)将原始数据标准化处理;(2)建立相关系数矩阵并计算其特征值和特征向量;将题目所给的相关系数矩阵输入并设为PHO,利用[x,y]=eig(PHO)求得PHO的特征值和特征向量。(3)选择特征值大于等于1的特征值个数为公共因子数,或者根据特征值累计贡献率大于80%来确定公共因子。从y表(特征值表)中我们可以看出大于等于1的特征值个数为4,所以