资源描述:
《主成分分析与因子分析的比较研究与实例分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、主成分分析与因子分析的比较研究与实例分析摘要:比较研究了主成分分析和因子分析理论及其联系与区别,实例分析了两种方法在实际应用中的差异性,得出结论:应用中应正确选择多元统计分析方法,并F•联系实际问题和专业具体分析。关键词:主成分分析;因子分析;实例ComparativeresearchandcaseanalysisofprincipalcomponentanalysisandfactoranalysisAbstract:thetheoryofprincipalcomponentanalysisandfactoranalysisaswellasthe
2、irrelationsanddistinctionsarecomparedandstudied,thedifferencesoftwomethodsinpracticalapplicationhavebeenanalyzed,coneludedthatthemethodshouldbechooscdrightlyandcontactedwiththeactualproblemandprofessionaltodospecificanalysis.Keywords:principalcomponentanalysis;factoranalysis;a
3、ctualexample引言研究实际问题时常涉及多个指标变量,且彼此间存在一定的相关性,使得数据存在着一定的信息重叠。单独研究单个变量会损失大量信息,选取几个综合变量又能充分反映原来变量的信息,且彼此之间不相关对实际研究带来了便利。主成分分析与因了分析是将多个指标化为少数儿个综合指标实现降维的统计方法。近年來这两种方法应用范围越來越多广泛,既存在着去多共同Z处,也有其各口的差显性⑴。1主成分分析与因子分析法理论1.1主成分分析法设研究对象有P个指标变量,分別为XI,X2,Xp表示,从而有均值为P,协方差矩阵为工的p维随机向量X二(XI,X2,Xp)
4、o通过主成分分析对X进行线性变换得到新的变量Y。即:_XHX12…Xlp_X=X21■■■X22■••…X2p■■■=(XPX2,...Xp)_XnlX〃2…X叽线性变换后:Y=^IX=U\X+况异2+・・・+绚/兀Y°=U;X=妁]X]+比+…+禺“X”W=/X=sX
5、+知2X2+…+fX〃为了变量Y能够充分反映原來X变量的信息,Yi的方差应尽可能人且YiZ间不相关,弘2+弘2+•••+弘2_1于是有:知+堆2十十知-I,(i=1,2,...,p)o主成分Yi可由协方差矩阵或相关矩阵求岀。一般选取累计贡献率达到85%以上的前儿个主成分作为研
6、究指标。1.2因子分析法因子分析有R型和Q型因子分析,实例中应用了R型因子分析。式屮X为原始变量及标准化后的变量,标准化后的公共因了为Fl,F2,Fm(m
7、是从变量的相关系数矩阵入手,在损失较少信息的前提F,把多个具有相关性变量综合成少数儿个综合变量来研究总体信息,且这少数儿个综合变量所代表的信息不能重叠,即新变量无相关性,是多元分析中实现降维的重要方法门V2主成分分析与因子分析的区别3.1理论思想不同主成分分析是设法将原來众多具有一定相关性的指标重新组合成一组新的相互无关的综合指标来代替原来指标。因了分析是通过变量的相关系数矩阵内部结构的研究,找出能控制所冇变量的少数几个随机变量(不可观测,通常称为因子⑸)去描述多个变量之间的相关关系。然后根据相关性大小将变量分组,使得同组内的变量之间相关性较髙,但
8、不同组内相关性较低。3.2数学模型不同(1)主成分分析的数学模空实质上是一种变换,通过变量变换把注意力集中在具有较大变差的那些主成分上,阳舍弃那些变差小的主成分;因子分析是把注意力集中在少数不可观测的潜在变量上,而舍弃特殊因了。(2)主成分分析是将主成分表示为原观测变量的线性组合。线性变换不改变原始数据的结构⑹;因子分析是描述X协方差阵结构的一•种模型,对原观测变量分解成公共因子和特殊因了两部分。(3)主成分的各系数aij是唯一确定的、正交的,不可以对系数矩阵进行任何的旋转,且系数大小并不代表原变量与主成分的和关程度⑺;因子模型的系数短阵是不唯一的
9、,且该矩阵表明了原变量和公共因了的相关程度。3.3计算方法不同主成分分析一般依据第一主成分的得分排名,若第一主成分不能完全