主成分分析,多元回归分析.ppt

主成分分析,多元回归分析.ppt

ID:49418734

大小:285.00 KB

页数:37页

时间:2020-02-06

主成分分析,多元回归分析.ppt_第1页
主成分分析,多元回归分析.ppt_第2页
主成分分析,多元回归分析.ppt_第3页
主成分分析,多元回归分析.ppt_第4页
主成分分析,多元回归分析.ppt_第5页
资源描述:

《主成分分析,多元回归分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第五章主成分分析什么是主成分分析主成分分析(PrincipalComponentsAnalysis)也称主分量分析是将多个指标,化为少数几个不相关的综合指标的一种统计方法。在综合评价工业企业的经济效益中,考核指标有:1每百元固定资产原值实现产值、2每百元固定资产原值实现利税、3每百元资金实现利税、4每百元工业总产值实现利税、5每百元销售收入实现利税、6每吨标准煤实现工业产值、7每千瓦电力实现工业产值、8全员劳动生产率、9每百元流动资金实现的产值指标间信息有重叠,指标数量又多。经过主成分分析计算,最后确定选择了2个主成分作为综合评价工业企业经济效益的依据,变量数由9个减少到2个,这两个主

2、成分代表的信息达91.6%,使所研究的问题简化。第一节主成分分析的几何意义X1X2几何意义:为了直观,先在二维空间中讨论主成分的几何意义。设对每个样品观测两个变量X1和X2的数据如下X1123456X224681012样品点完全在同一条直线上。X1X2其散点图如下θX1Y2X2Y1因为样品点都在Y1轴上,Y1方向有离散性,Y2方向无离散性,也就无区别。可以用Y1来描述这些样品点,,因此在新坐标系中只需用Y1一个变量就可以描述原来需用两个变量X1和X2描述的样品。那么Y1包含了原来变量X1和X2的100%的信息。在实际问题中,这样的情况是很少见的。一般情况下,例如有n个样品,每个样品有两

3、个变量值X1和X2,这n个样品的散点图如带状.由图可见这n个样品点无论是沿着X1轴方向或X2轴方向都具有较大的离散性,其离散的程度可以分别用观测变量X1的方差和X2的方差定量地表示。X1X2θX2Y2Y1X1同样我们将X1轴和X2轴同时按逆时针方向旋转θ角度,得到新坐标轴Y1和Y2。Y1和Y2是两个新变量。根据解析几何中的坐标旋转变换公式:第二节主成分的求解假设我们所讨论的实际问题中,有p个指标,我们把这p个指标看作p个随机变量,记为X1,X2,…,Xp主成分分析就是要把这p个指标的问题,转变为讨论p个指标的线性组合的问题主成分分析通常的做法是,寻求原指标的线性组合Yi。并且满足:1(

4、i=1,2,…P)*2不相关性,Yi与Yj不相关。3方差极大条件,主成分的求解:求系数,而其正是观测变量相关矩阵的单位特征向量。因此,通过求解的特征方程,得到P个特征根和P个单位特征向量,把P个特征根按从大到小的顺序排列,记作λi(i=1,2,…,p),它们分别代表P个主成分所解释的观测变量的方差,即Var(Yi)=λi(i=1,2,…,p)。相应的P个单位特征向量就是主成分的系数(i=1,2,…,p)。主成分Y=由的单位特征向量构成U,即由

5、-λI

6、=0求出λ然后代入(-λI)Z=0求出单位特征向量,构成U变量的标准化:由于主成分是根据变量的离散度也即方差的大小来确定主成分的,这样当

7、不同指标的量纲不同时,不同指标的方差大小差別很大,主成分会受到影响,例如:X1表年收入,从万元到百万元变化,X2表净收入与总资产之比,从0.01到0.60变化,那么X1的方差的绝对量将远远大于X2的方差,这样主成分会过于照顾方差大的变量,为使主成分能均等地对待每一个原变量,应将原变量作标准化处理.标准化公式:(i=1,2,…P)这时有=因此求U时可用的特征向量。还可以证明=所以==在实际问题中,利用主成分的目的是为了减少变量的个数,所以一般不用P个主成分,而是根据如下方法选取前K个主成分。定义为第i主成分Yi的方差贡献率。这个值越大,说明这个主成分Yi综合原指标信息的能力越强。主成分的

8、方差贡献率定义(K≤P)为主成分Yl,Y2,…,Yk的累积方差贡献率。当前K个主成分的累积方差贡献率达到85%以上时,就取K个主成分。这样K个主成分基本反映了原指标的信息,指标数目由P个减少到K个。这种由讨论多个指标降为少数几个综合指标的过程在数学上就叫做降维。(i=1,2,…P)对于标准化后的变量,则原始变量与主成分之间的相关系数主成分得分:当选取了n个主成分后,把样本数据代入各主成分表达式可得样本的主成分得分。若主成分是由原始数据协方差阵计算的,则计算主成分得分时,用原始数据。若主成分是由标准化数据计算,即由R计算,则计算主成分得分时,一定要用标准化数据,否则会出现错误。主成分的综

9、合得分利用主成分Yl,Y2,…,Yk作线性组合,并以每个主成分Yi的方差贡献率作为权数构造一个综合函数:Y=根据计算出的Y值大小进行排序。主成分的计算步骤:原始数据矩阵1、原始数据标准化2、计算样本协差阵或相关系数矩阵R3、求R的非零特征根及对应的标准正交特征向量4、求出主成分(i=1,2,…P)根据累计方差贡献率大于等于80%,85%,90%等,确定选取主成分个数。结合专业知识将各主成分给出恰当的解释,并运用其来判断样品的特性。例一应收账款是

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。