资源描述:
《应用多元统嫛分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、1应用多元统计分析第十章典型相关分析2第十章典型相关分析目录§10.1总体典型相关§10.2样本典型相关§10.3典型冗余分析3第十章典型相关分析相关分析是研究多个变量与多个变量之间的相关关系.如研究两个随机变量之间的相关关系可用简单相关系数表示;研究一个随机变量与多个随机变量之间的相关关系可用全相关系数表示.1936年Hotelling首先将相关分析推广到研究多个随机变量与多个随机变量之间的相关关系,故而产生了典型相关分析,广义相关系数等一些有用的方法.4第十章典型相关分析什么是典型相关分析在实际问题中,经常遇到要研究一部分变量和另一部分
2、变量之间的相关关系,例如:在工业中,考察原料的主要质量指标(X1,...,Xp)与产品的主要质量指标(Y1,...,Yq)间的相关性;在经济学中,研究主要肉类的价格与销售量之间的相关性;在地质学中,为研究岩石形成的成因关系,考察岩石的化学成份与其周围围岩化学成份的相关性;在气象学中为分析预报24小时后天气的可靠程度,研究当天和前一天气象因子间的相关关系;5第十章典型相关分析什么是典型相关分析在教育学中,研究学生在高考的各科成绩与高二年级各主科成绩间的相关关系;在婚姻的研究中,考察小伙子对追求姑娘的主要指标与姑娘想往的小伙子的主要尺度之间的相关关系;
3、在医学中,研究患某种疾病病人的各种症状程度与用科学方法检查的一些结果之间的相关关系;在体育学中,研究运动员的体力测试指标与运动能力指标之间的相关关系等.6第十章典型相关分析什么是典型相关分析一般地,假设有一组变量X1,...,Xp与另一组变量Y1,...,Yq(也可以记为Xp+1,...,Xp+q),我们要研究这两组变量的相关关系,如何给两组变量之间的相关性以数量的描述,这就是本章研究的典型相关分析.当p=q=1时,就是研究两个变量X与Y之间的相关关系.简单相关系数是最常见的度量.其定义为7第十章典型相关分析什么是典型相关分析当p≥1,q=1时(
4、或q≥1,p=1)设则称为Y与(X1,…,Xp)的全相关系数.其实Y对X的回归为且,并称R为全相关系数.def=8第十章典型相关分析什么是典型相关分析当p,q>1时,利用主成分分析的思想,可以把多个变量与多个变量之间的相关化为两个新变量之间的相关.也就是求=(1,…,p)和=(1,…,q),使得新变量:V=1X1+…+pXp=XW=1Y1+…+qYq=Y之间有最大可能的相关,基于这个思想就产生了典型相关分析(Canonicalcorrelatinalanalysis).9第十章§10.1总体典型相关设X=(X1,..
5、.,Xp)及Y=(Y1,...,Yq)为随机向量(不妨设p≤q),记随机向量Z=XYZ的协差阵为其中Σ11是X的协差阵,Σ22是Y的协差阵,Σ12=Σ’21是X,Y的协差阵.10第十章§10.1总体典型相关我们用X和Y的线性组合V=aX和W=bY之间的相关来研究X和Y之间的相关.我们希望找到a和b,使ρ(V,W)最大.由相关系数的定义:又已知11第十章§10.1总体典型相关故有对任给常数c1,c2,d1,d2,显然有ρ(c1V+d1,c2W+d2)=ρ(V,W)即使得相关系数最大的V=aX和W=bX并不唯一.故加附加约束条件Var(V)=
6、aΣ11a=1,Var(W)=bΣ22b=1.问题化为在约束条件Var(V)=1,Var(W)=1下,求a和b,使得ρ(V,W)=aΣ12b达最大.12第十章§10.1总体典型相关典型相关变量和典型相关系数的定义定义10.1.1设X=(X1,...,Xp)及Y=(Y1,...,Yq)为随机向量(不妨设p≤q),记Z=(X,Y).设随机向量Z的均值为0,协差阵Σ>0.如果存在a1=(a11,…,alp)和b1=(b11,...,blq)使得则称a1X,b1Y是X,Y的第一对典型相关变量,它们之间的相关系数称为第一个典型相关系数.
7、13第十章§10.1总体典型相关典型相关变量和典型相关系数的定义如果存在ar=(ar1,…,arp)和br=(br1,...,brq)使得(r=2,…,m;m<=p):(1)arX,brY和前面r-1对典型变量都不相关;(2)Var(arX)=1,Var(brY)=1;(3)Vr=arX,Wr=brY的相关系数最大.则称Vr,Wr为X,Y的第r对典型相关变量,它们之间的相关称为第r个典型相关系数.14第十章§10.1总体典型相关典型相关变量和典型相关系数的一般求法典型相关变量和典型相关系数的一般求法从第一对典型相关变量的解法中,我们知
8、道求第一对典型相关变量和第一个典型相关系数的问题,就是求解TT′的最大特征根和相应的特征向量.不仅如此,求解