欢迎来到天天文库
浏览记录
ID:22833700
大小:464.50 KB
页数:21页
时间:2018-10-22
《因子分析方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、因子分析方法演讲人:马金芳因子分析的基本概念因子分析的概念就是在尽可能不损失信息或少损失信息的情况下,将多个变量减少为少数几个潜在的因子。也就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子来反映原资料的大部分信息的统计学分析方法主成分分析(Principalcomponentanalysis):是因子分析的一个特例,是使用最多的因子提取方法。它通过坐标变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相关的变量。选取前面几个方差最大的主成分,这样达到了因子分析较少变量个数的目的,同时又能与较少的变量反映
2、原有变量的绝大部分的信息。两者关系:主成分分析(PCA)和因子分析(FA)是两种把变量维数降低以便于描述、理解和分析的方法,而实际上主成分分析可以说是因子分析的一个特例因子分析的基本模型因子分析模型中,假定每个原始变量由两部分组成:共同因子和唯一因子。共同因子是各个原始变量所共有的因子,解释变量之间的相关关系。唯一因子顾名思义是每个原始变量所特有的因子,表示该变量不能被共同因子解释的部分。原始变量与因子分析时抽出的共同因子的相关关系用因子负荷表示。因子分析最常用的理论模式如下:(j=1,2,3…,n,n为原始变量总数)(1)Zj
3、为第j个变量的标准化分数;(2)Fi(i=1,2,…,m)为共同因素;(3)m为所有变量共同因素的数目;(4)Uj为变量的唯一因素;(5)aij为因素负荷量。用矩阵的形式表示为Z=AF+UF称为因子,由于它们出现在每个原始变量的线性表达式(原始变量可以用Xj表示,这里模型中实际上是以F线性表示各个原始变量的标准化分数Zj),因此又称为公共因子.A称为因子载荷矩阵,aji称为因子载荷,是第j个原始变量在第i个因子上的负荷。U称为特殊因子,表示了原有变量不能被因子解释的部分,其均值为0,相当于多元线性回归模型中的残差。因子分析的特点
4、(1)因子变量的数量远少于原有的指标变量的数量,因而对因子变量的分析能够减少分析中的工作量。(2)因子变量不是对原始变量的取舍,而是根据原始变量的信息进行重新组构,它能够反映原有变量大部分的信息。(3)因子变量之间不存在显著的线性相关关系,对变量的分析比较方便,但原始部分变量之间多存在较显著的相关关系。(4)因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。因子分析数学模型中几个相关概念1、因子载荷(因素负荷量)因子载荷就是因素结构中,原始变量与因素分析时抽取出共同因素的相关。在因子不相关的前提下,因子载荷aji
5、是变量Zj和因子Fi的相关系数,反映了变量Zj与因子Fi之间的相关程度。因子载荷值aji小于等于1,绝对值越接近1,表明因子Fi与变量Zj的相关性越强。同时,因子载荷aji也反映了因子Fi对解释变量Zj的重要作用和程度。当要判断一个因子的意义时,需要查看哪些变量的负荷达到了0.3或0.3以上2、变量共同度(共同性)一个因子解释的是相关矩阵的方差,变量的方差由共同因子和唯一因子组成,可以表示成h+u2=1(h表示共同度,u2表示特殊因子的平方)。变量共同度就是指每个原始变量在每个共同因子的负荷量的平方和,是全部因子对变量方差解
6、释说明的比例。变量共同度h越接近1,说明因子全体解释说明了变量Zj的较大部分方差,如果用因子全体刻画变量,则变量的信息丢失较少;共同性的意义在于说明如果用共同因子替代原始变量后,原始变量的信息被保留的程度。特殊因子U的平方,反应了变量方差中不能由因子全体解释说明的比例,越小则说明变量的信息丢失越少。因子分析数学模型中几个相关概念总之,变量的共同度刻画了因子全体对变量信息解释的程度,是评价变量信息丢失程度的重要指标。如果大多数原有变量的变量共同度均较高(如高于0.8),则说明提取的因子能够反映原有变量的大部分信息(80%以上)信
7、息,仅有较少的信息丢失,因子分析的效果较好。因子,变量共同度是衡量因子分析效果的重要依据。2、变量共同度(共同性)3、因子的方差贡献(特征值)因子的方差贡献(特征值)的数学定义为:。该式表明,因子Fi的方差贡献是因子载荷矩阵A中第i列元素的平方和。因子Fi的方差贡献反映了因子Fi对原有变量总方差的解释能力,(其解释方差的大小成为因子的特征值)。该值越高,说明相应因子的重要性越高。因此,因子的方差贡献和方差贡献率是衡量因子重要性的关键指标。因子分析数学模型中几个相关概念举例说明:因子分析数学模型中几个相关概念因子分析的五大基本步骤
8、第一步:因子分析的前提条件由于因子分析的主要任务之一是对原有变量进行浓缩,即将原有变量中的信息重叠部分提取和综合成因子,进而最终实现减少变量个数的目的。因此它要求原有变量之间应存在较强的相关关系。否则,如果原有变量相互独立,相关程度很低,不存在信息重叠,它们不可
此文档下载收益归作者所有