欢迎来到天天文库
浏览记录
ID:38602922
大小:1.01 MB
页数:84页
时间:2019-06-16
《《SAS多元统计分析》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、Chapter7SAS多元统计分析Chapter7SAS多元统计分析多元统计分析是统计学的重要应用工具,SAS实现了许多常用的多元统计分析方法。SAS用于多变量分析的过程有PRINCOMP(主成分分析)、FACTOR(因子分析)、CANCORR(典型相关分析)、MDS(多维标度过程)、MULTTEST(多重检验)、PRINQUAL(定性数据的主分量分析)、CORRESP(对应分析),用于判别分析的过程有DISCRIM(判别分析)、CANDISC(典型判别)、STEPDISC(逐步判别),用于聚类分析的过程有CLUSTER(谱系聚类)、FASTCLU
2、S(K均值快速聚类)、MODECLUS(非参数聚类)、VARCLUS(变量聚类)、TREE(画谱系聚类的结果谱系图并给出分类结果)。下一页返回本节首页Chapter7SAS多元统计分析一、主成分分析二、因子分析三、聚类分析四、判别分析下一页返回本节首页上一页一、主成分分析㈠主成分分析简介㈡数学模型与几何解释㈢PRINCOMP过程㈣菜单操作方法㈤主成分的应用⒈主成分回归:解决多重共线性问题⒉综合评价下一页返回本节首页上一页㈠主成分分析简介在实际经济工作中,我们经常碰到多变量或多指标问题,比如,企业经济效益的评价、地区经济发展情况比较等问题。这些问题的研究
3、一般都先要设定研究的指标,也就是设定评价企业经济效益与评价地区经济发展情况的指标体系。由于变量或指标较多,分析问题具有相当的复杂性。然而,在多数情况下,这些不同的变量或指标之间,存在一定的相关性。这样,人们自然希望用较少的变量或指标来代替原来较多的变量或指标,而这些较少的变量或信息涵盖了原来变量或指标的信息。利用这种降维的思想,产生了主成分分析方法。下一页上一页主成分分析,就是设法将原来变量或指标重新组合成一组新的、互不相关的几个综合变量或指标,同时根据实际需要从中选取几个较少的综合变量或指标来尽可能多地反映原变量或指标的信息。这种将多变量或多指标转化
4、成少数几个互不相关的综合变量或综合指标的统计方法叫做主成分分析或称主分量分析。需要注意的是,主成分分析往往不是目的,而是达到目的的一种手段。因此,它常常用在大型研究项目的某个中间环节中。例如,将它用到多重回归中,便产生了主成分回归,它可以克服回归问题中由于自变量之间的高度相关而产生的分析困难。另外,主成分分析还可以用于典型相关分析、聚类分析和因子分析中。下一页返回本节首页上一页㈡数学模型与几何解释假设我们所讨论的实际问题中,有p个指标,我们把这p个指标看作p个随机变量,记为X1,X2,…,Xp,主成分分析就是要把这p个指标的问题,转变为讨论p个指标的线
5、性组合的问题,而这些新的指标F1,F2,…,Fk(k≤p),按照保留主要信息量的原则充分反映原指标的信息,并且相互独立。这种由讨论多个指标降为少数几个综合指标的过程在数学上就叫做降维。主成分分析通常的做法是,寻求原指标的线性组合Fi。满足如下的条件:主成分之间相互独立,即无重叠的信息。即主成分的方差依次递减,重要性依次递减,即每个主成分的系数平方和为1。即•••••••••••••••••••••••••••••••••••••主成分分析的几何解释平移、旋转坐标轴为了方便,我们在二维空间中讨论主成分的几何意义。设有n个样品,每个样品有两个观测变量xl和
6、x2,在由变量xl和x2所确定的二维平面中,n个样本点所散布的情况如椭圆状。由图可以看出这n个样本点无论是沿着xl轴方向或x2轴方向都具有较大的离散性,其离散的程度可以分别用观测变量xl的方差和x2的方差定量地表示。显然,如果只考虑xl和x2中的任何一个,那么包含在原始数据中的经济信息将会有较大的损失。如果我们将xl轴和x2轴先平移,再同时按逆时针方向旋转角度,得到新坐标轴Fl和F2。Fl和F2是两个新变量。根据旋转变换的公式:旋转变换的目的是为了使得n个样品点在Fl轴方向上的离散程度最大,即Fl的方差最大。变量Fl代表了原始数据的绝大部分信息,在研
7、究某经济问题时,即使不考虑变量F2也无损大局。经过上述旋转变换原始数据的大部分信息集中到Fl轴上,对数据中包含的信息起到了浓缩作用。Fl,F2除了可以对包含在Xl,X2中的信息起着浓缩作用之外,还具有不相关的性质,这就使得在研究复杂的问题时避免了信息重叠所带来的虚假性。二维平面上的个点的方差大部分都归结在Fl轴上,而F2轴上的方差很小。Fl和F2称为原始变量x1和x2的综合变量。F简化了系统结构,抓住了主要矛盾。㈢PRINCOMP过程进行主成份分析PRINCOMP过程的一般格式:ProcPrincompDATA=数据集选项列表>;Var变量列表;P
8、artial变量列表;Weight变量;Freq变量;By变量;Run;下一页上一页⒈PROC
此文档下载收益归作者所有