主成分分析PCA.ppt

主成分分析PCA.ppt

ID:49499231

大小:970.50 KB

页数:31页

时间:2020-02-06

主成分分析PCA.ppt_第1页
主成分分析PCA.ppt_第2页
主成分分析PCA.ppt_第3页
主成分分析PCA.ppt_第4页
主成分分析PCA.ppt_第5页
资源描述:

《主成分分析PCA.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、在实际问题中,研究多指标的问题是经常遇到的,然而在多数情况下,不同指标之间是有一定关系的。由于指标较多再加上指标之间有一定的相关性,势必增加了分析问题的复杂性。主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标,同时根据实际需要从中可取几个较少的综合指标尽可能多滴反映原来指标的信息。这种多个指标化为少数互不干扰的综合指标的统计方法叫做主成分分析法,如某人要做一件上衣要测量很多尺寸,如身长、袖长、胸围、腰围、肩宽、肩厚等十几项指标。但是某服装产生产一批新型服装绝不可能吧尺寸型号分的过多。而是从其中选取

2、几个综合性的指标作为分类型号。1、反映胖瘦。2、反映特体。3、反映长度。主成分分析PCA指标身长X1袖长X2胸围X3腰围X4肩宽X5肩厚X6Y1=a11*X1+a12X2+a13X3+a14X4+a15X5+a16X6Y2=a21*X1+a22X2+a23X3+a24X4+a25X5+a26X6Y3=a31*X1+a32X2+a33X3+a34X4+a35X5+a36X6Y1反映胖瘦Y2反映特体Y3反映长度主成分分析是一种通过降维技术把多个指标约化为少数几个综合指标的综合统计分析方法,而这些综合指标能够反映原始指标的绝大部分信息,

3、它们通常表现为原始几个指标的线性组合。数学模型将原来p个指标记X1,X2,…,Xp.再寻求这p个变量的线性组合F1,F2,…Fk(k≤p)满足2.主成分之间互不相关,即无重叠的信息。即1.主成分的方差依次递减,重要性依次递减,即3.每个主成分的系数平方和为1。即主成分的数学推导主成分的一般性质主成分的方差贡献率设有n个样品,每个样品观测p个指标,将原始数据写成矩阵形式1、将原始数据标准化2、建立变量的相关系数阵3、求R的特征根及相应的单位特征向量特征值大的贡献大。贡献率=特征值/所有特征值和主成分计算步骤或协方差矩阵这里我们需要进

4、一步强调的是,从相关阵求得的主成分与协差阵求得的主成分一般情况是不相同的。实际表明,这种差异有时很大。我们认为,如果各指标之间的数量级相差悬殊,特别是各指标有不同的物理量纲的话,较为合理的做法是使用R代替∑。对于研究经济问题所涉及的变量单位大都不统一,采用R代替∑后,可以看作是用标准化的数据做分析,这样使得主成分有现实经济意义,不仅便于剖析实际问题,又可以避免突出数值大的变量。4、写出主成分一般取累计贡献率达85—95%的特征值所对应的第一、第二,…,第m(m≤p)个主成分。5、根据特征值,确定各成分权重,进行综合指标,排序。协方

5、差及协方差矩阵的定义协方差的定义主成分分析实例表1是某市工业部门13个行业的8项重要经济指标的数据,这8项经济指标分别是:X1:年末固定资产净值,单位:万元;X2:职工人数据,单位:人;X3:工业总产值,单位:万元;X4:全员劳动生产率,单位:元/人年;X5:百元固定资产原值实现产值,单位:元;X6:资金利税率,单位:%;X7:标准燃料消费量,单位:吨;X8:能源利用效果,单位:万元/吨。表1某市工业部门13个行业8项指标我们要考虑的是:如何从这些经济指标出发,对八个指标进行适当的缩减,便于我们对某市经济状态做定性分析?Matla

6、b计算主成分clearsj=load('zcf.txt')sj1=zscore(sj)xfc1=cov(sj1);xgxs=corrcoef(sj1);[t1t2]=eig(xfc1)[T1,T2]=eig(xgxs)0.002442000000000.032184000000000.086598000000000.30408000000000.64212000000000.93022000000002.8974000000003.1049-0.245-0.75762-0.065854-0.184220.0453030.10419

7、0.295990.47665-0.527110.51841-0.0484510.30545-0.174430.162980.277890.472810.780540.174040.0990480.0174750.058670.156260.377950.42385-0.220130.249430.28786-0.539410.51609-0.00854430.45141-0.21289-0.030623-0.232970.582290.4499-0.199420.321130.33094-0.388460.042355-0.056

8、436-0.713570.316840.279260.145140.40274-0.35243-0.04116-0.0528420.193590.41820.758170.14046-0.377410.214830.0032996-0.067111

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。