SAS系统和数据分析典型相关分析.doc

SAS系统和数据分析典型相关分析.doc

ID:61035726

大小:1.39 MB

页数:43页

时间:2021-01-20

SAS系统和数据分析典型相关分析.doc_第1页
SAS系统和数据分析典型相关分析.doc_第2页
SAS系统和数据分析典型相关分析.doc_第3页
SAS系统和数据分析典型相关分析.doc_第4页
SAS系统和数据分析典型相关分析.doc_第5页
资源描述:

《SAS系统和数据分析典型相关分析.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第三十七课典型相关分析典型相关分析(CanonicalCorrelationAnalysis)是研究两组变量间相关关系的一种多元统计分析方法。它能够揭示两组变量之间的内在联系,真正反映两组变量间的线性相关情况。一、典型相关分析我们研究过两个随机变量间的相关,它们可以用相关系数表示。然而,在实际中常常会遇到要研究两组随机变量间和的相关关系问题。和可能是完全不同的,但是它们的线性函数可能存在密切的关系,这种密切的关系能反映和之间的相关关系。因此,就要找出的一个线性组合及的一个线性组合,希望找到的和之间有最大可能的相关系数,以充分反映两组变量间的关系。这样就把研究两组随机变量间

2、相关关系的问题转化为研究两个随机变量间的相关关系。如果一对变量(,)还不能完全刻画两组变量间的相关关系时,可以继续找第二对变量,希望这对变量在与第一对变量(,)不相关的情况下也具有尽可能大的相关系数。直到进行到找不到相关变量对时为止。这便引导出典型相关变量的概念。1.典型相关系数与典型相关变量设有两组随机变量和,假定它们都已经标准化了,即,,若记:此时,它们的协方差矩阵(也是相关系数矩阵)为:其中,实际上,我们要找:使和的相关系数达到最大。由于对任意常数,,,,有(其中,),因而不妨假定:(37.1)(37.2)此时,。在与的条件下,使达到最大的与分别与和组成的新变量:(

3、37.3)称为第一对典型变量,其相关系数称为第一典型相关系数。若用一对变量还不足以完全反映两组变量的相关时,可以定义第二对典型变量,这时除要求,外,还要求,,和,在这些条件下使达到最大。一般地,第对典型变量定义如下:称为第对典型变量,其系数向量与使达到最大,并且满足如下条件:(37.4),此时称为第对典型相关系数。1.求法我们采用Lagrage乘子法,从开始逐一求、。下面仅以、的求法作一简述,以下假定是正定矩阵。记:(37.5)其中,、为Lagrage乘子,用、表示仅仅为了下面计算式的简单而已。将对、分别求偏导,并令其为0,再与约束条件联立,则、应满足以下方程组:(37.

4、6)在式(37.6)的前二式两边左乘和,并利用式(37.6)的后二式有:,(37.7)由于,故有。再由(37.6)及的非奇异性知:(37.8)将其代入式(37.6),则:(37.9)再由的非奇异性知:(37.10)记,式(37.10)表明是的特征根,是其对应的特征向量。又由式(37.7)知是与的相关系数,要求其达到最大,一定是的最大特征根,是最大特征根对应的特征向量;进而可由式(37.8)求出。第一典型相关系数是的最大特征根的算术根。其实也可证明是的最大特征根对应的特征向量。由于M1与M2有相同的非零特征根,因此,此时求出的和直接从式(37.8)求出的是一致的。用同样方法

5、可知是M1的第二大的特征根对应的特征向量,可通过下式求出:(37.11)一般来说,可求出M1的个非零特征根,M1对应于这些特征根的特征向量分别记为、、…、,进而:(37.12)j=1,2,…,r,以、为系数可组成第对典型变量,。第对典型变量对应的相关系数是的算术根,这便是第个典型相关系数,j=1,2,…,r,这里r≤min(p,q)。实际应用中,通常是未知的,已知的只是的个样品:,,…,。我们只能从样本去其估计、和。然后,用相应的估计量代替中相应的未知参数矩阵,因此要考虑矩阵的非零特征根及相应的特征向量,有关的计算可按以前讨论的方法进行。一、应注意的几个问题l典型相关是研

6、究两组变量之间相关性的一种统计分析方法。与主成分分析一样,它也是一种降维技术。多重相关是典型相关的一个特例,简单相关是多重相关的一个特例。l第一对典型相关包含有最多的有关两组变量间相关的信息,第二对其次,其他对依次递减,各对典型相关所含的信息互不重复。l经标准化的两组变量间的典型相关系数与原始的两组变量间的相应典型相关系数是相同的。l典型变量的最大对数等于两组变量中较少一组的变量个数。l每个典型变量除在另一组里与其配对的那个典型变量外,它同所有其他典型变量均不相关。l第一对典型相关的大小至少同任一变量与对应的那组变量间的多重相关一样大。l至于选取多少对典型相关可通过检验来

7、确定。二、Cancorr典型相关分析过程描述两组变量之间的相关性,可用典型相关过程cancorr完成。简单相关和多重相关都是典型相关的特殊情况,此时两组变量中有一组或两组只含一个变量。对于两组变量,如果一组变量用x表示,另一组变量用y表示,那么典型相关分析就是找出(>l)个变量的线性组合值与(>l)个变量的线性组合值,使两者之间的相关达到最大。cancorr过程一般由下列语句控制:proccancorrdata=数据集<选项列表>;var变量列表;with变量;partial变量列表;freq变量;weight变量;by变量列

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。