主成分分析(共享).doc

主成分分析(共享).doc

ID:51916082

大小:226.00 KB

页数:13页

时间:2020-03-19

主成分分析(共享).doc_第1页
主成分分析(共享).doc_第2页
主成分分析(共享).doc_第3页
主成分分析(共享).doc_第4页
主成分分析(共享).doc_第5页
资源描述:

《主成分分析(共享).doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、主成分分析类型:一种处理高维数据的方法。降维思想:在实际问题的研究中,往往会涉及众多有关的变量。但是,变量太多不但会增加计算的复杂性,而且也会给合理地分析问题和解释问题带来困难。一般说来,虽然每个变量都提供了一定的信息,但其重要性有所不同,而在很多情况下,变量间有一定的相关性,从而使得这些变量所提供的信息在一定程度上有所重叠。因而人们希望对这些变量加以“改造”,用为数极少的互补相关的新变量来反映原变量所提供的绝大部分信息,通过对新变量的分析达到解决问题的目的。一、总体主成分1.1定义设X],x2

2、,Xp为某实际问题所涉及的P个随机变量。记X=(x2,X2,-,Xp)T,其协方差矩阵为s=yp"[(X-E(X))(X-E(X))5它是一个P阶非负定矩阵。设丫卩(1)则有VariXt)=Var(l{X)=ZfSZ,,i=1,2,・・・丿,(乙,rp=Cov(l{XjjX)=l:禺J=1,2,・・・,p.第i个主成分:一般地,在约朿条件Coviy,赧)=1;级=0北=1,2,・・・,i一1.下,求h使Var(Yj达到最大,由此h所确定的X=l:X称为X],x2,Xp的第i个主成分。1.2总体主

3、成分的计算设刀是X=(X^X29...9Xp)T的协方差矩阵,刀的特征值及相应的正交单位化特征向量分别为2]n兄2n…n2卩no(3)则X的第i个主成分为丫匚=勺X=e订X]+€i2X2+…+勺”X”,i=1,2,・・・,p9此时Var(Y.)=eZei=,i=1,2,・・・,p,Cov(YnYk)=e{Zek=Q,i羊k・1.3总体主成分的性质1.3.1主成分的协方差矩阵及总方差记Y=(Y^Y2^Yp)T为主成分向量,则Y=PTX,其中P=(勺灼,・・・灼),且Cov(Y)=Cov(PTX)

4、=PTZP=A=ZMag(人丿2,・・・,兄“),由此得主成分的总方差为即主成分分析是把P个原始变量X2,X2,Xp的总方差1=1分解成P个互不相关变量Y],Y2,丫卩的方差之和,即1=1

5、njVar(Yk)=2fro第k个主成分的贡献率:-p-1=1mEA前m个主成分累计贡献率:,它表明前m个主成分Y],丫2,1=1丫111综合提供X],x2,Xp中信息的能力。1.3.2主成分£与变量务的相关系数由于Y=PTX,故X=PY,从而Xj=eijYl+e2jY2+***+,Cov(y/,X>)=2/

6、.^/.・由此可得Yj与务的相关系数为(4)CoviY^X.)&勺J%"0=—=—1Qg_严心)Js(Xj)_阴飯一飯iJ1.4标准化变量的主成分在实际问题中,不同的变量往往有不同的量纲,由于不同的量纲会引起各变量取值的分散程度差异较大,这时总体方差则主要受方差较大的变量的控制。为了消除由于量纲的不同可能带来的影响,常采用变量标准化的方法,即令其中Pi=E(XJ,6=VaNXJ・这时的协方差矩阵便是的相关矩阵p=Sj治,其中Pij=E(X:X=Cov(X,,X/)利用X的相关矩阵p作主成分分析

7、,有如下结论:设X(X;,X;,・・・,X;)丁为标准化的随机向量,其协方差矩阵(即X的相关矩阵)为Q,则X*的第i个主成分为(7)并且VPV£Var(Y;)=£>1;=£畑(X;)=p,(8)1=11=11=1其中石";》・・";"为Q的特征值…;=(晡&2,・・・,

8、通过样本来估计。设£=(兀订,乞2今•••,Xjp)=1,2,・・•,"・为取自X的一个容量为n的简单随机样本,则样本协方差矩阵及样本相关矩阵分别1n㈡认严荷若ETg®,其中]nX=(兀]9兀2,…,X”)9j~—〉:兀"•,/=1,2,・・・9P1”^ij=—(Xf(i—兀i)(兀灯—X'=・・・9p."一1心1分别以S和R作为刀和Q的估计,然后按总体主成分分析的方法作样本主成分分析。三、例题某市为了全面分析机械类个企业的经济效益,选择了8个不同的利润指标,14企业关于这8个指标的统计数据如下

9、表所示,试进行主成分分析。14家企业的利润指标的统计数据变量企业序号净产值利润率(%)Xu固定资产利润率(%)Xi2总产值利润率(%)Xi2销售收入利润率(%)Xi3产品成本利润率(%)Xi5物耗利润率(%)Xi6人均利润率七7(千元/人)流动资金利润率(%)Xi8140.424.77.26.18.38.72.44220.0225.012.711.211.012.920.23.5429.1313.23.33.94.34.45.50.5783.6422.36.75.63.76.07.40.1767

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。