主成分分析原理及详解

主成分分析原理及详解

ID:38741597

大小:328.00 KB

页数:8页

时间:2019-06-18

主成分分析原理及详解_第1页
主成分分析原理及详解_第2页
主成分分析原理及详解_第3页
主成分分析原理及详解_第4页
主成分分析原理及详解_第5页
资源描述:

《主成分分析原理及详解》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第14章主成分分析1概述1.1基本概念1.1.1定义主成分分析是根据原始变量之间的相互关系,寻找一组由原变量组成、而彼此不相关的综合变量,从而浓缩原始数据信息、简化数据结构、压缩数据规模的一种统计方法。1.1.2举例为什么叫主成分,下面通过一个例子来说明。假定有N个儿童的两个指标x1与x2,如身高和体重。x1与x2有显著的相关性。当N较大时,N观测量在平面上形成椭圆形的散点分布图,每一个坐标点即为个体x1与x2的取值,如果把通过该椭圆形的长轴取作新坐标轴的横轴Z1,在此轴的原点取一条垂直于Z1的直线定为新坐标轴的Z2,于是这N个点在新坐标轴上的坐标位置发生了改变;同

2、时这N个点的性质也发生了改变,他们之间的关系不再是相关的。很明显,在新坐标上Z1与N个点分布的长轴一致,反映了N个观测量个体间离差的大部分信息,若Z1反映了原始数据信息的80%,则Z2只反映总信息的20%。这样新指标Z1365称为原指标的第一主成分,Z2称为原指标的第二主成分。所以如果要研究N个对象的变异,可以只考虑Z1这一个指标代替原来的两个指标(x1与x2),这种做法符合PCA提出的基本要求,即减少指标的个数,又不损失或少损失原来指标提供的信息。1.1.3函数公式通过数学的方法可以求出Z1和Z2与x1与x2之间的关系。Z1=l11x1+l12x2Z2=l21x1

3、+l22x2即新指标Z1和Z2是原指标x1与x2的线性函数。在统计学上称为第一主成分和第二主成分。若原变量有3个,且彼此相关,则N个对象在3维空间成椭圆球分布,见图14-1。通过旋转和改变原点(坐标0点),就可以得到第一主成分、第二主成分和第三主成分。如果第二主成分和第三主成分与第一主成高度相关,或者说第二主成分和第三主成分相对于第一主成分来说变异很小,即N个对象在新坐标的三维空间分布成一长杆状时,则只需用一个综合指标便能反映原始数据中3个变量的基本特征。3651.2PCA满足条件1.2.1一般条件一般来说,N个对象观察p个指标,可以得到N*p个数据(矩阵)。只要p

4、个指标之间存在有相关关系,就可以通过数学的方法找到一组新的指标,它们需要满足的条件如下。(1)Zi是原指标的线性函数,且它们相互垂直;(2)各个Zi互不相关;(3)各个Zi加起来提供原指标所含的全部的信息,且Z1提供信息最多,Z2次之,依次类推。1.2.2PCA的一般步骤(1)输入或打开数据文件;(2)数据进行标准化处理;(3)计算矩阵的相关系数;(4)求相关矩阵的特征根λ1、λ2、λ3,并将它们按大小排序。(5)求特征向量和各主成分;(6)计算各主成分的贡献率;(7)解释各主成分的含义上述的步骤大部分由SPSS执行,用户需要选择观测对象、选择变量,收集数据,将数据

5、输入SPSS程序,最后选择需要多少个主成分,解释各主成分的实际意义。1.3SPSS运行主要选择项1.3.1操作步骤Analyzes/datareduction/factor/openfactoranalyzes/对话框,主要有5个对话框,下面简要介绍。365因子分析主对话框。主要用来选择变量、选择输出结果内容和多少、选择PCA有关数学处理如是否旋转,提取多少个因子数,是否保存各个因子得分等。lFactorAnalysis:因子分析;lDescriptive:描述性统计选项;lExtraction:提取因子选项;lRotation:旋转选择;lScores:因子得分选

6、项;lOption:其它选项。1.3.2主对话框1.3.3Descriptive对话框lStatistics:统计数据uUnivariatedescriptive:单变量描述性统计;uInitialsolution:初始解的统计量。lCorrelationmatrix:相关矩阵uCoeffcients:相关系数矩阵。uInverse:相关系数矩阵逆矩阵。uSignificancelevels:相关系数显著性水平。uReproduced:再生相关矩阵。给出因子分析后的相关矩阵。3651.3.4Extractionmethod提取公因子方法lMethod:方法uPrin

7、cipalcomponentsanalyze:主成分分析uUnweightleastsquares:未加权最小二乘法uGeneralizedleastsquares:广义最小二乘法lAnalysis:分析uCoeffcientsmatrix:相关系数矩阵。uCovariancematrix:协方差矩阵。lDisplay:显示365uUnrotatedfactorsolution:非旋转因子解。uScreenplotoftheeigenvalues:特征值碎石图。lExtract:提取。uEigenvaluesover1:系统默认值是1,表示提取特征值大于1的因子

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。