欢迎来到天天文库
浏览记录
ID:38043314
大小:40.50 KB
页数:4页
时间:2019-05-24
《主成份文分析法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、主成分分析的主要目的是希望用较少的变量去解释原来资料中的大部分变异,将我们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量。通常是选出比原始变量个数少,能解释大部分资料中的变异的几个新变量,即所谓主成分,并用以解释资料的综合性指标。由此可见,主成分分析实际上是一种降维方法。求主成分方法步骤(1)数据标准化; 设有n个样品,P个指标,得到的原始资料矩阵为了实现样本数据的标准化,应求样本数据的平均和方差。样本数据的标准化是基于数据的平均和方差进行的。因为在实际应用中,往往存在指标的量纲不同,所以
2、在计算之前须先消除量纲的影响,而将原始数据标准化。 对数据矩阵Y作标准化处理,即对每一个指标分量作标准化变换,变换公式为: 其中:样本均值样本标准差得标准化后的数据矩阵(2)计算相关矩阵 对于给定的n个样本,求样本间的相关系数。相关矩阵中的每一个元素由相应的相关系数所表示。其中(3)求特征值和特征向量设求得的相关矩阵为R,求解特征方程:
3、R-λi
4、=0 通过求解特征方程,可得到m个特征值(i=1~m),和对应于每一个特征值的特征向量:ai=(ai1,ai2,...,ai
5、p) i=1~m 且有λ1≥λ2≥λ3≥λm≥0设相应λ1的特征向量Ai=(α1i,α2i,...,αpi) i=1~m(4)求主成分(取线性组合) 根据求得的m个特征向量,m个主要成分分别为: F1=α11x1+α12x2+...+α1pxp F2=α21x1+α22x2+...+α2pxp .................. Fm=αm1x1+αm2x2+...+αmpxp 上式就是主成分分析的模型,其通式为: Fi=αi1x1+αi2x2+...+αip
6、xp i=1,2,...m称为主成份,称F1是第一主成份,F2是第二主成份,Fi是第i主成份。 求各主成份的关键是求特征根(λ)及其相应的特征向量(α)。 主成分分析以较少的m个指标代替了原来的p个指标对系统进行分析,这给我们对系统的综合评价带来了很大的方便。(5)定义:称为第一主成分的贡献率。这个值越大,表明第i主成分综合信息的能力越强。称为前m个主成分的累计贡献率。表明取前几个主成分基本包含了全部测量指标所具有信息的百分率。保留多少个主成分取决于保留部分的累积方差在方差总和中所占百
7、分比(即累计贡献率),它标志着前几个主成分概括信息之多寡。实践中,粗略规定一个百分比便可决定保留几个主成分;如果多留一个主成分,累积方差增加无几,便不再多留。若m个主成分的累计贡献率超过85%,那我们认为前m个主成分基本包含了原来指标信息,一般选取累积贡献率达到85%以上时的因子个数。小结进行主成分分析主要步骤如下: 1.指标数据标准化; 2.指标之间的相关性判定; 3.确定主成分个数m; 4.主成分Fi表达式; 5.主成分Fi命名;
此文档下载收益归作者所有