主成分分析是处理降维的一种方法

主成分分析是处理降维的一种方法

ID:40270865

大小:124.50 KB

页数:4页

时间:2019-07-30

主成分分析是处理降维的一种方法_第1页
主成分分析是处理降维的一种方法_第2页
主成分分析是处理降维的一种方法_第3页
主成分分析是处理降维的一种方法_第4页
资源描述:

《主成分分析是处理降维的一种方法》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、主成分分析是处理降维的一种方法。将多个指标化为少数相互无关的综合指标的统计方法叫做主成分分析。主成分分析的基本思想是通过构造原变量的适当的线性组合,以产生一系列互不相关的新信息,从中选出少数几个新变量并使它们含有尽可能多的原变量带有的信息,从而使得用这几个新变量代替原变量分析问题和解决问题成为可能。当研究的问题确定之后,变量中所含“信息”的大小通常用该变量的方差或样本方差来度量。因子分析是主成分分析的推广和发展,它是将具有错综复杂关系的变量(或样品)综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,同时根据不同因子还可以对变量进行分

2、类,它也是属于多元分析中处理降维的一种统计方法。因子分析的基本思想是通过变量的相关系数矩阵内部结构的研究,找出能控制所有变量的少数几个随机变量去描述多个变量之间的相关关系,但在这里,这少数几个随机变量是不可观测的,通常称为因子。然后根据相关性的大小把变量分组,使得同组内的变量之间相关性较高,但不同组的变量相关性较低。典型相关分析的基本思想:结合主成分分析的思想,自然是考虑X的综合指标(X的线性函数)与Y的综合指标之间的相关性程度来刻画X与Y的相关性,即把两组变量的相关,变为两个新变量(线性函数)之间的相关来讨论,同时又尽量保留原来变量的信息,或

3、者说,找X的线性函数和找Y的线性函数,使这两个线性函数具有最大的相关性。(称这种相关为典型相关,称形成的两个线性函数即两个新的变量为典型变量。)继而,还可以分别找X与Y的第二对线性函数。是其与第一对典型变量不相关,而这两个线性函数之间又具有最大的相关性。如此继续进行下去,直到两组变量X与Y之间的相关性被提取完毕为止。判别分析就是解决分类问题,模式识别的分类问题就是根据待识别对象的特征向量值及其它约束条件将其分到某个类别中去。统计判别分析理论是模式分类问题的基本理论之一,它对模式分析和分类器的设计有着实际的指导意义。距离判别法的基本思想:首先根据

4、已知分类的数据,分别计算各类的重心即分组(类)的均值,判别准则是对任给的一次观测,若它与第i类的重心距离最近,就认为它来自第i类。距离判别法对各类(或总体)的分布,并无特定的要求。系统聚类法的基本思想:先将每个研究对象(样品或指标)各自看成一类,按某种顺序分别称作第1,第2,…第h类(如果对象是样品,则h=n;如果对象是指标,则h=p);然后根据对象间的相似度量,将h类中最相似的两类合并,组成一个新类,这样得到h-1类,再在这h-1类中找出最相似的两类,得到h-2类,如此下去,直至将所有的对象并成一个大类为止。系统聚类法优点:既可以对观测量(样

5、品)也可对变量进行聚类,既可以是连续变量也可以是分类变量,提供的距离计算方法和结果显示方法也很丰富。系统聚类法基本步骤初始化过程:(1)样本集:(2)选择样本间距离的定义及类间距离的定义;(3)构造n个类,每类只含有一个样本;(4)计算n个样本两两之间的距离,得到距离矩阵,记作;归并类过程:(5)合并距离最近的两类为一个新类,称作第n+1类,并取消刚合并的那两类,这样得到n-1类;(6)计算新类与剩余各类的距离,其他各类间距离不变,得到降一阶的新距离矩阵。若类的个数等于1,则转到步骤7;否则,回到步骤5.决策过程:(7)画出聚类图;(8)决定类

6、的个数和类。正交试验的的极差分析法的一般步骤:1、定指标,确定因素,选水平;2、选用适当的正交表,表头设计,确定实验方案;3、严格按条件做实验,并记录实验结果。4、计算各列的统一水平的数据和与极差;5、按极差大小排出因素的主次;6、选取较优生产条件;7、进行验证性试验,做进一步分析。主成分分析是处理降维的一种方法。将多个指标化为少数相互无关的综合指标的统计方法叫做主成分分析。主成分分析的基本思想是通过构造原变量的适当的线性组合,以产生一系列互不相关的新信息,从中选出少数几个新变量并使它们含有尽可能多的原变量带有的信息,从而使得用这几个新变量代替

7、原变量分析问题和解决问题成为可能。当研究的问题确定之后,变量中所含“信息”的大小通常用该变量的方差或样本方差来度量。因子分析是主成分分析的推广和发展,它是将具有错综复杂关系的变量(或样品)综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,同时根据不同因子还可以对变量进行分类,它也是属于多元分析中处理降维的一种统计方法。因子分析的基本思想是通过变量的相关系数矩阵内部结构的研究,找出能控制所有变量的少数几个随机变量去描述多个变量之间的相关关系,但在这里,这少数几个随机变量是不可观测的,通常称为因子。然后根据相关性的大小把变量分组,使得同

8、组内的变量之间相关性较高,但不同组的变量相关性较低。典型相关分析的基本思想:结合主成分分析的思想,自然是考虑X的综合指标(X的线性函数)与Y的综合指标

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。