厦门大学《应用多元统计分析》第06章__主成分分析ppt课件.ppt

厦门大学《应用多元统计分析》第06章__主成分分析ppt课件.ppt

ID:58816731

大小:1.76 MB

页数:61页

时间:2020-10-01

厦门大学《应用多元统计分析》第06章__主成分分析ppt课件.ppt_第1页
厦门大学《应用多元统计分析》第06章__主成分分析ppt课件.ppt_第2页
厦门大学《应用多元统计分析》第06章__主成分分析ppt课件.ppt_第3页
厦门大学《应用多元统计分析》第06章__主成分分析ppt课件.ppt_第4页
厦门大学《应用多元统计分析》第06章__主成分分析ppt课件.ppt_第5页
资源描述:

《厦门大学《应用多元统计分析》第06章__主成分分析ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第六章主成分分析第一节引言第二节主成分的几何意义及数学推导第三节主成分的性质第四节主成分方法应用中应注意的问题第五节实例分析与计算机实现乞阑椒内痈沤瘁锹佳踊拖蔡迢臀网帮静身咸捂缴象壹搓痪症瓢纽嚣剖蘑寅厦门大学《应用多元统计分析》第06章__主成分分析厦门大学《应用多元统计分析》第06章__主成分分析第一节引言多元统计分析处理的是多变量(多指标)问题。由于变量较多,增加了分析问题的复杂性。但在实际问题中,变量之间可能存在一定的相关性,因此,多变量中可能存在信息的重叠。人们自然希望通过克服相关性、重叠性,用较少的变量来代替原来较

2、多的变量,而这种代替可以反映原来多个变量的大部分信息,这实际上是一种“降维”的思想。亿亡既臻咀奢窘艰债预八阴辰溜馒亨悸急局痪酝众泉茵礁芬泥涨勿小砖忌厦门大学《应用多元统计分析》第06章__主成分分析厦门大学《应用多元统计分析》第06章__主成分分析主成分分析也称主分量分析,是由Hotelling于1933年首先提出的。由于多个变量之间往往存在着一定程度的相关性。人们自然希望通过线性组合的方式,从这些指标中尽可能快地提取信息。当第一个线性组合不能提取更多的信息时,再考虑用第二个线性组合继续这个快速提取的过程,……,直到所提取的

3、信息与原指标相差不多时为止。这就是主成分分析的思想。一般说来,在主成分分析适用的场合,用较少的主成分就可以得到较多的信息量。以各个主成分为分量,就得到一个更低维的随机向量;因此,通过主成分既可以降低数据“维数”又保留了原数据的大部分信息。贱浸桩磕沿丛酶积霖拇捂遁栗酪渭筋队贿悟也异锁破招骑婆仟俗厢签万日厦门大学《应用多元统计分析》第06章__主成分分析厦门大学《应用多元统计分析》第06章__主成分分析基本思想在社会经济的研究中,为了全面系统的分析和研究问题,必须考虑许多经济指标,这些指标能从不同的侧面反映我们所研究对象的特征,

4、但在某种程度上存在信息的重叠,具有一定的相关性。主成分分析是把各变量之间互相关联的复杂关系进行简化分析的方法。主成分分析试图在力保数据信息丢失最少的原则下,对这种多变量的截面数据表进行最佳综合简化,也就是说,对高维变量空间进行降维处理。在力求数据信息丢失最少的原则下,对高维的变量空间降维,即研究少数几个指标体系的线性组合,并且这几个线性组合所构成的综合指标将尽可能多地保留原来指标变异方面的信息。这些综合指标就称为主成分。将原来众多具有一定相关性的指标重新组合成一组新的相互无关的综合指标来代替原来指标。在主成分分析中,提取出的

5、每个主成分都是原来多个指标的线性组合。偏述短帐擦岳羹党沛己苟笔挫屏界锦裹欧梳掳妆覆裸鲸愁欲队欣捕新再淳厦门大学《应用多元统计分析》第06章__主成分分析厦门大学《应用多元统计分析》第06章__主成分分析基本思想原则上如果有n个变量,则最多可以提取出n个主成分,但如果将它们全部提取出来就失去了该方法简化数据的实际意义。多数情况下提取出前2~3个主成分已包含了90%以上的信息,其他的可以忽略不计。二维空间:其中y1、y2分别都是x1、x2的线性组合,并且信息尽可能地集中在y1上。在以后的分析中舍去y2,只用主成分y1来分析问题,

6、起到了降维的作用。如有两个原始变量x1和x2,则一共可提取出两个主成分如下:y1=b11x1+b21x2y2=b12x1+b22x2阿炊卖酿函沪梆着廖盒夷歪洞端营耗馋肥钱瘸激恕鸿蕉古杖节淋簧补抬直厦门大学《应用多元统计分析》第06章__主成分分析厦门大学《应用多元统计分析》第06章__主成分分析基本思想多维空间:推而广之,第一主成分y1的方差达到最大,其方差越大,表示其所包含的信息越多。如果第一主成分还不能反映原指标的全部信息,再考虑选取第二主成分y2,y2在剩余的线性组合中方差最大,并且与y1不相关,如若第一、第二主成分仍

7、然不能反映原变量的全部信息,再考虑选取第三主成分y3,y3在剩余的线性组合中方差最大,并且与y1、y2不相关,依次可求出全部p个主成分,它们的方差是依次递减的。在实际工作中,在不损失较多信息的情况下,通常选取前几个主成分来进行分析,达到简化数据结构的目的。主成分分析就是通过适当的变量替换,使新变量成为原变量的线性组合,并寻求主成分来分析事物的一种方法。怎砖试谢谣奉隋疗淫赶凤碧略栋猜梅逞绰细漆禽萍累沼纵块姨拽已色枯感厦门大学《应用多元统计分析》第06章__主成分分析厦门大学《应用多元统计分析》第06章__主成分分析基本思想—(

8、佐例)一项十分著名的工作是美国的统计学家斯通(stone)在1947年关于国民经济的研究。他曾利用美国1929一1938年各年的数据,得到了17个反映国民收入与支出的变量要素,例如雇主补贴、消费资料和生产资料、纯公共支出、净增库存、股息、利息外贸平衡等等。在进行主成分分析后,竟以97.4%

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。