资源描述:
《主成分分析与因子分析的异同》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、主成分分析与主成分分析与因子分析的异同---------------------------------------------------------------------------------------------------------------------ABSTRACT设=(X1,…,XP为标准化随机向量(p≥2),R为相关系数矩阵,=(F1,…,Fm为主成分向量,=(Z1,…,Zm为因子向量,m≤p,为方便,因子、因子估计、因子得分用同一记号。一、 问题的提出主成分分析与R-型因子分析是多元统计分析中的两个
2、重要方法,同是降维技术,应用范围十分广泛,但通过流行甚广的SPSS软件调用这两种方法的过程命令,有些使用者容易出现混淆性错误,如《统计研究》2003年第12期发表的论文《经济全球化程度的量化研究》(以下称《刘文》)、电子工业出版社2002年9月出版的《SPSSforWindows统计分析(第二版)》(以下称《卢书》)就是这种情况。是什么原因造成这些错误呢?主成分分析与R-型因子分析到底有何异同呢?经过对一些论文和一些SPSS软件教科书仔细查证分析、比较我们发现出错的主要原因在于有些使用者和SPSS软件教科书作者对怎样用SPSS软件
3、得出主成分分析与R-型因子分析的结果掌握不全面,对主成分分析与R-型因子分析异同的认识不透彻。经过仔细查证出现的错误有:使用主成分分析时①叙述主成分分析概念出错。②主成分F求解出错,如=中(为单位矩阵,的意义见表1)。③找不到主成分F的命名依据,对主成分F命名出错。④某变量Xk被丢失。⑤对错误地进行旋转。⑥错误地进行回归求F。⑦错误地把因子分析法(含初始因子分析法)当作主成分分析法。使用因子分析时①将因子分析的思想叙述为主成分分析的思想。②因子Zi的命名出错,如用因子得分函数对因子Zi进行命名。③某变量Xk被丢失。④将主成分或因子
4、错误地表示为(的意义见表1)。⑤不知相关系数矩阵特征值与因子贡献vi的区别,如综合因子得分函数Z综=Zi中的vi错误地取为特征值。二、主成分分析与R-型因子分析数学模型的异同比较相同之处:主成分分析与R-型因子分析都是对协差阵的逼近,都是打算降维解释数据集。具体为指标的正向化,指标的标准化(SPSS软件自动执行),通过相关系数矩阵判断变量间的相关性,求相关系数矩阵的特征值和特征向量,主成分间、因子间线性无关,用累计贡献率(%)、变量不出现丢失确定主成分、因子个数m,前m个主成分与前m个因子对X的综合贡献相同、是最大化的,命名依据都
5、是主成分、因子与变量的相关系数。不同之处:方差,最大化方向,标准正交性,应用上侧重等不同见表1。主成分分析与因子分析计量上不同的显著性标志是方差。事实上,VarFi>(<)VarZi=1,即Fi的取值范围比Zi的取值范围大(小);通常VarF综>VarZ综,即F综的取值范围比Z综的取值范围大,这些都肯定了主成分分析与因子分析的计量值、评价体系不同。结论:主成分分析与因子分析两种方法方差、最大化方向不同,直接导致主成分值、因子得分值、综合评价值和应用侧重上不同,综合评价应该分开进行,混淆在一起是不同计量值交替错误。三、避免出错的方法
6、步骤1.主成分分析法和SPSS软件应用时一对一的正确步骤:① 指标的正向化。②指标数据标准化(SPSS软件自动执行).③指标之间的相关性判定:用SPSS软件中表“CorrelationMatrix(相关系数矩阵)”判定。④确定主成分个数m:用SPSS软件中表“TotalVarianceExplained(总方差解释)”的主成分方差累计贡献率%、结合表“ComponentMatrix(初始因子载荷阵)”中变量不出现丢失确定主成分个数m。 ⑤主成分Fi表达式(这是SPSS软件及其教科书中没完善的地方):将SPSS软件中表“Co
7、mponentMatrix”中的第i列向量除以第i个特征根的开根后就得到第i个主成分Fi的变量系数向量(在“transform-->compute”中进行计算),由此写出主成分表1 主成分分析与R-型因子分析的不同区别项目主成分分析数学模型:R-型因子分析数学模型:表达式与系数矩阵=()=(…,),,是相应的特征值和单+(为特殊因子),因子载荷矩阵m=()=,位特征向量,≥…≥≥0。=(…,)为初始因子载荷矩阵*(同左)。因变量方差最大化 Fi依次达到信息贡献(方差)最大化,VarF
8、i=。 Zi没有达到方差最大化,VarZi=1。矩阵方差最大化旋转无,旋转后就不是主成分了,因为VarFi≠λi。有,为方差最大正交旋转矩阵,m达到方差最大化。因变量对X的贡献特征值。vi=,vi,通常>v1。相关系数=。=。