主成分因子分析

主成分因子分析

ID:32369877

大小:228.17 KB

页数:7页

时间:2019-02-03

主成分因子分析_第1页
主成分因子分析_第2页
主成分因子分析_第3页
主成分因子分析_第4页
主成分因子分析_第5页
资源描述:

《主成分因子分析》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、一主成分分析法的原理主成分分析法是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法这些综合指标通常被称为主成分,主成分相比原始变量而言,具有更多的优越性,即在研究许多复杂问题时不至于丢失太多信息,从而使我们更容易抓住事物的主要矛盾,提高分析效率该方法的核心就是通过主成分分析,选择n个主分量Y1,Y2,…,Yn,其中Yi(i=1,2,,n)为第i个主成分的得分,以主分量Yi的方差贡献率ai作为权数,构造综合评价函数:Y=a1Y2+a2Y2++anYn,这样当我们把第i个主成分的得分算出来后,便可以很快求出综合得分,并且按

2、照得分的高低来排序同时我们可以根据第i个主成分的得分来衡量某地区或某企业在第i个主成分所代表的经济效益方面的地位二、主成分分析的基本思想 在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应

3、这一要求产生的,是解决这类题的理想工具。  同样,在科普效果评估的过程中也存在着这样的问题。科普效果是很难具体量化的。在实际评估工作中,我们常常会选用几个有代表性的综合指标,采用打分的方法来进行评估,故综合指标的选取是个重点和难点。如上所述,主成分分析法正是解决这一问题的理想工具。因为评估所涉及的众多变量之间既然有一定的相关性,就必然存在着起支配作用的因素。根据这一点,通过对原始变量相关矩阵内部结构的关系研究,找出影响科普效果某一要素的几个综合指标,使综合指标为原来变量的线性拟合。这样,综合指标不仅保留了原始变量的主要信息,且彼此间不相关,又比原始变

4、量具有某些更优越的性质,就使我们在研究复杂的科普效果评估问题时,容易抓住主要矛盾。上述想法可进一步概述为:设某科普效果评估要素涉及个指标,这指标构成的维随机向量为。对作正交变换,令,其中为正交阵,的各分量是不相关的,使得的各分量在某个评估要素中的作用容易解释,这就使得我们有可能从主分量中选择主要成分,削除对这一要素影响微弱的部分,通过对主分量的重点分析,达到对原始变量进行分析的目的。的各分量是原始变量线性组合,不同的分量表示原始变量之间不同的影响关系。由于这些基本关系很可能与特定的作用过程相联系,主成分分析使我们能从错综复杂的科普评估要素的众多指标中

5、,找出一些主要成分,以便有效地利用大量统计数据,进行科普效果评估分析,使我们在研究科普效果评估问题中,可能得到深层次的一些启发,把科普效果评估研究引向深入。  例如,在对科普产品开发和利用这一要素的评估中,涉及科普创作人数百万人、科普作品发行量百万人、科普产业化(科普示范基地数百万人)等多项指标。经过主成分分析计算,最后确定个或个主成分作为综合评价科普产品利用和开发的综合指标,变量数减少,并达到一定的可信度,就容易进行科普效果的评估。三、主成分分析方法的原理(一)成分分析法是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分

6、量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的p个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。(二)主成分分析的基本思路即:在设计指标体系时尽可能多的选择指标,然后用一种方这些指标的特点综合而成少数几个新的指标,这几个新指标既能够尽可能多地反映原来的指标的信息,而且彼此间又差异显著。如果从数学上对主成分分析进行解释,即为:设有p个原始指标:X1,X2,X3

7、…,Xp,用来对n个单位进行评价,则共有np个数据。主成分分析的目的是要将这些原始指标组合成新的相互独立的综合指标:y1,y2,y3…,yp,这些综合指标表现为原始指标的线性函数:y1=l11X1+l12X2+…+l1pXp,y2=l21X1+l22X2+…+l2pXp……………………………Yp=lp1X1+lp2X2…lppXp通过数学计算可将p个原始指标的总方差分解为p个不相关的综合指标的方差之和λ1+λ2+…+λp,并使第一个综合指标y1方差达到最大(贡献率最大),第二个综合指标y2的方差次大,以此类推,一般前面几个综合指标y1、y2、yr(r

8、

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。