资源描述:
《典范相关分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、实用多变数分析4、典范相关分析CanonicalCorrelationAnalysis1、典范变数与典范相关若对一个个体观察了一组(p+q)个、可分成两种不同类型(或不同性质的)性状:x’=(x1,x2,…,xp),y’=(y1,y2,...,yq)如:对小麦品系(单株)考察了株高、茎粗、(剑)叶长、叶宽、穗下节间长、单株成穗数、主穗小穗数、每穗粒数、千粒重、单株产量等性状,可将前面的5个性状看成是株型性状,后面6个性状看成是穗部或产量性状,它们分别以x,y表示。这样的性状分类事实上很常见,如株型与产量性状,产量与品质性状,淀
2、粉与蛋白质性状,RVA特征值与淀粉蛋白质性状,长度与重量性状,价格与消费量性状等等。当考察了n个个体以后,我们往往要了解两组变数在整体上有无关系?有多大的关系?用典范相关的语言,指的是一组变数主要方向上的变异能否由另一组变数主要方向上的变异所说明?及其这种说明的程度?设x变数的线性组合为:ξ=a’x=a1x1+a2x2+…+apxp;y变数的线性组合为:η=b’y=b1y1+b2y2+…+bqyqa’=(a1,a2,…,ap),b’=(b1,b2,…,bq),能否有a,b,使ξ与η之间有一个最大的相关?即,ρξη=max在求a
3、,b时,须满足的条件有:E(ξ)=E(η)=0,V(ξ)=V(η)=1求最大的相关系数ρξη=max,即是根据条件:V(ξ)=V(a’x)=a’V(x)a=a’Σxxa=1V(η)=V(b’y)=b’V(y)b=b’Σyyb=1构造一个函数(G):这里,λ1,λ2称为拉格朗日乘子(Lagrangemultiplier),这在求条件极值时经常采用。使a’Σxyb最大,亦即使G最大,常采用:因此,假定Σxx,Σyy有逆,解上述方程组:由可见,λ1,这一拉格朗日乘子,就是所求的ξ与η的相关系数。再由:前式可写成:将(3)代入(2)式
4、得:以及:上式可理解为:相对于的特征值和特征向量;相对于其λ2是共有的特征值。λ2和b是λ2和a是的特征值和特征向量。及上式中λ2和a是的特征值和特征向量;的特征值和特征向量。λ2和b是其中的λ2是共有的特征值。若令:代入式得到:这里,λ2和γ是B=T’*T=T*T’的特征值和特征向量,其中具有这种形式的矩阵B是非负定的,其特征值一定大于0,即:(λ21,λ22,…,λ2r)λ2≥0,r=min(p,q)。通过B=以及(B-λ2I)=0,求解λ2的r次方程,得到r个根,将其由大到小顺序排列由此再求解r个特征向量(γ1,γ2,.
5、..,γr)。(λ21≥λ22≥…≥λ2r≥0),这ξ1,η1称为第1对典范变数,λ1为第1典范相关系数(注:不是)。第1典范相关系数具有最大值。ξ2,η2称为第2对典范变数,λ2为第2典范相关系数,依此类推。典范变数的几点特征:1)ξi与ξj是相互独立的,ηi与ηj也是独立的,这可从特征值、特征向量(亦即主成分)的特性可知;2)ξi与ηj是相互独立的,它们间的相关系数为0;由于到此,似乎解决了所有的问题,但中的怎么算?对于若有特征值θi与特征向量li,则:该式称为矩阵Σ的谱分解(spectrumdecomposition)以
6、上的分析是在原始数据的基础上进行的,典范相关更多地是在数据标准化的基础上进行,即每一个变数具有同等的权重。因而,典范相关分析从相关阵开始。若从相关系数矩阵开始:将用R取代Σ,用RXX取代ΣXX,用RXY取代ΣXY,用RYY取代ΣYY,与上述过程进行相同的运算,求出a,b,以及λ。2、典范变数的应用第1典范变数ξ1,η1代表了具有最大相关的两组变数最大变异度方向的线性组合:典范变数的系数向量a,b的含义。aki和bli大小反映了xk和yl变数对第i对典范变数的作用。它们的正负代表了作用的方向,其大小代表了作用程度。绝对值越小,说
7、明这些变数在第i对典范变数中作用微弱,aki和bli(绝对值)越大,说明这些变数在第i对典范变数中有较大的作用。根据其正负、大小,可为揭示两组变数的关系(的解释)起到一定作用。由于两组多维变数的关系退化成两个1维变数之间的关系,这种关系可用图形的形式表示出来,使这种关系一目了然,便于对结果的分析与解释。3、典范相关系数的测验Bartlett(1941)提出了一个测验方法,对于第1典范相关系数λ1:对于第2典范相关系数λ2:对于第j个典范相关系数λj:4、一些例子Matlab中的命令:[a,b,r,u,v,stats]=cano
8、ncorr(x,y)helpcanoncorrCANONCORRCanonicalcorrelationanalysis.[A,B]=CANONCORR(X,Y)computesthesamplecanonicalcoefficientsfortheN-by-P1andN-b