欢迎来到天天文库
浏览记录
ID:49518603
大小:535.00 KB
页数:29页
时间:2020-02-06
《spss主成分分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、2021/8/301第二章主成分分析目录上页下页返回结束§2.1主成分分析的基本思想与理论§2.2主成分分析的上机实现2021/8/302第二章主成分分析目录上页下页返回结束主成分分析(principalcomponentsanalysis)。主成分分析是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法。通常把转化生成的综合指标称之为主成分,其中每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,这就使得主成分比原始变量具有某些更优越的性能。这样在研究复杂问题时就
2、可以只考虑少数几个主成分而不至于损失太多信息,从而更容易抓住主要矛盾,揭示事物内部变量之间的规律性,同时使问题得到简化,提高分析效率。2021/8/303目录上页下页返回结束§2.1主成分分析的基本思想既然研究某一问题涉及的众多变量之间有一定的相关性,就必然存在着起支配作用的共同因素,根据这一点,通过对原始变量相关矩阵或协方差矩阵内部结构关系的研究,利用原始变量的线性组合形成几个综合指标(主成分),在保留原始变量主要信息的前提下起到降维与简化问题的作用,使得在研究复杂问题时更容易抓住主要矛盾。一般地说,
3、利用主成分分析得到的主成分与原始变量之间有如下基本关系:1.每一个主成分都是各原始变量的线性组合;2.主成分的数目大大少于原始变量的数目2021/8/304目录上页下页返回结束3.主成分保留了原始变量绝大多数信息4.各主成分之间互不相关通过主成分分析,可以从事物之间错综复杂的关系中找出一些主要成分,从而能有效利用大量统计数据进行定量分析,揭示变量之间的内在关系,得到对事物特征及其发展规律的一些深层次的启发,把研究工作引向深入。2021/8/305目录上页下页返回结束§2.2主成分分析的基本理论设对某一事
4、物的研究涉及个指标,分别用表示,这个指标构成的维随机向量为。设随机向量的均值为,协方差矩阵为。对进行线性变换,可以形成新的综合变量,用表示,也就是说,新的综合变量可以由原来的变量线性表示,即满足下式:(5.1)2021/8/306目录上页下页返回结束§2.3注意的问题1.首先应当认识到主成分分析方法适用于变量之间存在较强相关性的数据,如果原始数据相关性较弱,运用主成分分析后不能起到很好的降维作用,即所得的各个主成分浓缩原始变量信息的能力差别不大。一般认为当原始数据大部分变量的相关系数都小于0.3时,运用
5、主成分分析不会取得很好的效果。2主成分分析不能有效地剔除重叠信息,但它至少可以发现原始变量是否存在着重叠信息,这对我们减少分析中的失误是有帮助的。2021/8/307目录上页下页返回结束§2.4主成分分析步骤1.根据研究问题选取初始分析变量;2.根据初始变量特性判断由协方差阵求主成分还是由相关阵求主成分;3.求协差阵或相关阵的特征根与相应标准特征向量;4.判断是否存在明显的多重共线性,若存在,则回到第一步;5.得到主成分的表达式并确定主成分个数,选取主成分;6.结合主成分对研究问题进行分析并深入研究。2
6、021/8/308目录上页下页返回结束主成分分析的逻辑框图特征值标准正交特征向量是否有接近0的情况是其他处理否主成分对主成分进行分析深入分析选择初始变量度量或取值范围相同?是否(否)对比分析相关阵分析协方差阵主成分分析的逻辑框图见图:【例5.2】数据集Employeedata为Midwestern银行在1969-1971年之间雇员情况的数据,共包括474条观测及如下10个变量:Id(观测号)、Gender(性别)、Bdate(出生日期)、Educ(受教育程度(年数))、Jobcat(工作种类)、Sala
7、ry(目前年薪)、Salbegin(开始受聘时的年薪)、Jobtime(受雇时间(月))、Prevexp(受雇以前的工作时间(月))、Minority(是否少数民族)。下面我们用主成分分析方法处理该数据,以期用少数变量来描述该地区居民的雇佣情况。2021/8/309目录上页下页返回结束§2.5主成分分析的上机实现SPSS软件FACTOR模块提供了主成分分析的功能。下面先以SPSS软件包自带的数据Employeedata.sav为例介绍主成分分析的上机实现方法,在SPSS软件的安装目录下可以找到该数据集;
8、然后,我们举一个实际的例子介绍主成分分析的具体应用。2021/8/3010目录上页下页返回结束§主成分分析的上机实现进入SPSS软件,打开数据集Employeedata.sav。依次点选Analyze→DataReduction→Factor….进入FactorAnalysis(因子分析)对话框。(在SPSS软件中,主成分分析与因子分析均在FactorAnalysis模块中完成。此时,数据集Employeedata.sav中的变量名均已显示
此文档下载收益归作者所有