[理学]第10章 主成份分析和因子分析

[理学]第10章 主成份分析和因子分析

ID:27870572

大小:1.22 MB

页数:62页

时间:2018-12-04

[理学]第10章 主成份分析和因子分析_第1页
[理学]第10章 主成份分析和因子分析_第2页
[理学]第10章 主成份分析和因子分析_第3页
[理学]第10章 主成份分析和因子分析_第4页
[理学]第10章 主成份分析和因子分析_第5页
资源描述:

《[理学]第10章 主成份分析和因子分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第10章主成分分析与因子分析主成分分析因子分析中央财经大学统计学院学习目标1.主成分分析的基本思想2.主成分分析的软件实现和结果分析3.因子分析的基本思想4.因子分析的软件实现和结果分析2中央财经大学统计学院主成分分析中央财经大学统计学院主成分分析的原理多元统计分析处理的是多变量(多指标)问题。由于变量较多,增加了分析问题的复杂性。但在实际问题中,变量之间可能存在一定的相关性,因此,多变量中可能存在信息的重叠。人们自然希望通过克服相关性、重叠性,用较少的变量来代替原来较多的变量,而这种代替可以反映原来多个变量的大部分信息,这实际上是一种“降维”的思想。“主成分分析”、“因子

2、分析” 都可以用来对数据进行降维。4中央财经大学统计学院主成分分析的基本思想主成分分析(Principalcomponentsanalysis)是由Hotelling于1933年首先提出的。由于多个变量之间往往存在着一定程度的相关性。人们自然希望通过线性组合的方式,从这些指标中尽可能快地提取信息。当这些变量的第一个线性组合不能提取更多的信息时,再考虑用第二个线性组合继续这个提取的过程,……,直到提取足够多的信息为止。这就是主成分分析的思想。5中央财经大学统计学院主成分分析的基本思想主成分分析适用于原有变量之间存在较高程度相关的情况。在主成分分析适用的场合,一般可以用较少的主

3、成分得到较多的信息量,从而得到一个更低维的向量(即更少的变量)。通过主成分既可以降低数据“维数”又保留了原数据的大部分信息。6中央财经大学统计学院例:斯通关于国民经济的研究一项十分著名的工作是美国的统计学家斯通(Stone)在1947年关于国民经济的研究。他曾利用美国1929一1938年各年的数据,得到了17个反映国民收入与支出的变量要素,例如雇主补贴、消费资料和生产资料、纯公共支出、净增库存、股息、利息、外贸平衡等等。在进行主成分分析后,竟以97.4%的精度,用三个新变量就取代了原17个变量。7中央财经大学统计学院主成分分析的几何意义•••••••••••••••••••

4、••••••••••••••••••如果仅考虑X1或X2中的任何一个分量,那么包含在另一分量中的信息将会损失,因此,直接舍弃x1或x2分量不是“降维”的有效办法。8中央财经大学统计学院主成分分析的几何意义平移、旋转坐标轴•••••••••••••••••••••••••••••••••••••对坐标轴进行旋转,n个点在F1轴上的方差达到最大,即在此方向上包含了有关n个样品的最大量信息。因此,欲将二维空间的点投影到某个一维方向上,则选择F1轴方向能使信息的损失最小。9中央财经大学统计学院主成分分析的几何意义第一主成分的效果与椭圆的形状有关。椭圆越扁平,n个点在F1轴上的方差就

5、相对越大,在F2轴上的方差就相对越小,用第一主成分代替所有样品造成的信息损失就越小。10中央财经大学统计学院••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••主成分分析的几何意义原始变量不相关时,主成分分析没有效果。11中央财经大学统计学院•••••••••••••••••••••••••••••••••••••主成分分析的几何意义原始变量相关程度越高,主成分分析效果越好。12中央财经大学统计学院主成分分析的数学模型方程满足下

6、列条件:(1)(2)Fi与Fj不相关。(3)F1与Fp到方差依次递减。13中央财经大学统计学院主成分分析的数学模型有p个x,相应可以计算出p个主成分。但一般只使用少数几个主成分就可以提取大部分信息。主成分分析的基本任务是计算系数矩阵a11…app。14中央财经大学统计学院主成分求解的步骤主成分可以按以下步骤计算得出:计算原始变量的相关系数矩阵R。计算相关系数矩阵R的特征值,并按从大到小的顺序排列,记为计算特征值对应的特征向量,即为主成分F1……Fp相应的系数。15中央财经大学统计学院主成分得分把原始变量的值代入主成分表达式中,可以计算出主成分得分。注意在计算主成分得分时需要

7、先对原始变量进行标准化。得到的主成分得分后,可以把各个主成分看作新的变量代替原始变量,从而达到降维的目的。16中央财经大学统计学院主成分的贡献率对于第k个主成分,其对方差的贡献率为前k个主成分贡献率的累计值称为累计贡献率。17中央财经大学统计学院主成分个数的确定通常有两种方式:1、根据大于1的特征值的个数确定主成分的个数;2、根据主成分的累计贡献率确定主成分的个数,使累计贡献率>85%或者其他值。最常见的情况是主成分的个数为2-3个。(一般会同时考虑以上因素和实际问题的背景信息。)18中央财经大学统计学院主成分分析

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。