资源描述:
《主成份分析法用于评价需注意的若干问题.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、30人类工效学2002年3月第8卷第1期文章编号:10068309(2002)01003004主成份分析法用于评价需注意的若干问题陈伟(中国科学技术大学数学系,安徽合肥230026)摘要:文章首先指出主成份分析法的原理,然后分析了主成份分析的若干特性,最后指出主成份分析法应用于评价中需注意的若干问题。关键词:主成份分析;评价;问题中图分类号:O212.4文献标识码:A1引言v11v12v1p主成份分析是一种常用的多元统计方法,它v21v22v2p在社会经济、企业管理及地质、生化、医药等各个...V=(vij)=(C
2、ov(xi,xj))=领域中都有着广泛的应用,如服装行业的服装定...型、企业的经济效益分析、新开发项目目标的制订...[1,2]等问题。vp1vp2vpp主成份分析的目标,就是要对多变量的高维vij就是第i个变量的方差,因此这p个变量系统进行最佳简化。也就是说,要在力保数据信p息丢失最少的原则下,对高维变量空间进行降维总的变化状况可以用vij来反映(实际中,V可以i=1[3]处理。由样本矩阵X近似求出)。现在的问题是,能否设评价问题有p个指标x1,x2,,xp,这p个找到一组新的变量y1,y2,,ym(m
3、价对象的各个属性,因此每个对象yj=Ljx,j=1,,m观察到的p个指标值就是一个样本值,它是一个p维的向量。如果有n个对象,就有n个p维向LjR={L:LL=1}(R称为p维正则化量,用矩阵X表示就有向量的集合)x11x12x1p满足:x21x22x2py1是一切形如y=Lx中方差达到最大者...(LR)X=...y2是一切形如y=Lx中与y1不相关且方...差达到最大者(LR)xn1xn2xnpyk是一切形如y=Lx中
4、与y1,,yk-1都若把p个指标x1,x2,,xp看成随机变量,不相关而方差达到最大者(LR),k=3,4,,m它们的期望值和协方差矩阵是该问题就是求maxVr(y)=Vr(Lx)x11=LVLx22s.t.LL=1..Ex=E=用拉格朗日乘数法,建立目标函数..Q=LVL-(LL-1)..Q于是=2VL-2LxppL作者简介:陈伟(1971),男,重庆人,讲师,博士,主要从事运筹学与控制论、系统工程、评价理论、优化理论等研究。人类工效学2002年3月第8卷第1期31Q最相关。由=
5、0,Lp2(y1,xj)max有VL=L,LL=1,j=1这表明L是矩阵V的特征向量,利用上式,有式中,(,)表示相关系数。Vr(y)=LVL=LL=因有Vr(yk)=k,k=1,,m也即特征根就是变量y的方差。因此只要求出最大特征根对应的特征向量L,主成份就可解出。Vr(xj)=vj,j=1,,p这样求出的新变量y1,y2,,ym均是原变量Cov(yk,xj)=E(ykxj)=E(xjyk)x1,x2,,xp的线性组合(m
6、,vjp)Lk构成的坐标系是原坐标系经平移和正交旋转后得令到的,称y1,y2,,ym构成的空间为m维主超平lk1面。lk22主成份分析的特性.Lk=,由前2.1数据变异方向最大.在主成份分析后的主超平面上,第一主分量.y1一定对应于数据变异最大的方向,即,原样本lkp群点在y1方向上投影的分布方差为最大,即(V-kIp)Lk=0V(y1)max有对于第二主分量y2以及y3,,ym,依次有(vj1,vj2,,vjp)Lk=klkj,于是V(y1)V(y2)V(ym)Cov(yk,xj)(yk,xj)=Vr(yk)Vr(
7、xj)而且y1,y2,,ym相互正交。2.2数据简化信息损失最少k=lkj所谓数据信息,主要反映在数据方差上。方vij差越大,数据中所含的信息就越多。主成份分析所以pp2产生的m维主超平面,能够保留原始数据尽可能2l1j(y1,xj)=1多的信息。j=1j=1vjj记V=(vij)pp为原变量的协方差阵,为新一般有vjj=v,j=1,,p变量的协方差阵。所以p因为21(y1,xj)=maxj=1vLL=Ip及如果要以两个变量y1,y2来取代原变量系Vr(y)=LVL=统,则第二主分量y2是与y1
8、垂直,并与所有xj所以p的相关度第二大的综合变量,即vij=tr(V)=tr(VLL)2pi=12p(yh,xj