资源描述:
《协方差的概念及应用.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、个人收集整理勿做商业用途两个不同参数之间的方差就是协方差 若两个随机变量X和Y相互独立,则E[(X—E(X))(Y—E(Y))]=0,因而若上述数学期望不为零,则X和Y必不是相互独立的,亦即它们之间存在着一定的关系. 定义 E[(X—E(X))(Y-E(Y))]称为随机变量X和Y的协方差,记作COV(X,Y),即COV(X,Y)=E[(X—E(X))(Y-E(Y))]。 协方差与方差之间有如下关系: D(X+Y)=D(X)+D(Y)+2COV(X,Y) D(X-Y)=D(X)+D(Y)—2COV(X,Y) 因此,COV(X,Y)=
2、E(XY)-E(X)E(Y)。[编辑本段]协方差的性质 (1)COV(X,Y)=COV(Y,X); (2)COV(aX,bY)=abCOV(X,Y),(a,b是常数); (3)COV(X1+X2,Y)=COV(X1,Y)+COV(X2,Y)。 由协方差定义,可以看出COV(X,X)=D(X),COV(Y,Y)=D(Y)。 协方差作为描述X和Y相关程度的量,在同一物理量纲之下有一定的作用,但同样的两个量采用不同的量纲使它们的协方差在数值上表现出很大的差异。为此引入如下概念: 定义 ρXY=COV(X,Y)/√D(X)√D(Y),称为
3、随机变量X和Y的相关系数。 定义 若ρXY=0,则称X与Y不相关。 即ρXY=0的充分必要条件是COV(X,Y)=0,亦即不相关和协方差为零是等价的。 定理 设ρXY是随机变量X和Y的相关系数,则有 (1)∣ρXY∣≤1; (2)∣ρXY∣=1充分必要条件为P{Y=aX+b}=1,(a,b为常数,a≠0) 定义 设X和Y是随机变量,若E(X^k),k=1,2,.。.存在,则称它为X的k阶原点矩,简称k阶矩。个人收集整理勿做商业用途 若E{[X—E(X)]^k},k=1,2,。。.存在,则称它为X的k阶中心矩。 若E(X^k
4、Y^l),k、l=1,2,.。。存在,则称它为X和Y的k+l阶混合原点矩. 若E{[X—E(X)]^k[Y-E(Y)]^l},k、l=1,2,。..存在,则称它为X和Y的k+l阶混合中心矩。 显然,X的数学期望E(X)是X的一阶原点矩,方差D(X)是X的二阶中心矩,协方差COV(X,Y)是X和Y的二阶混合中心矩。[编辑本段]协方差在农业上的应用 农业科学实验中,经常会出现可以控制的质量因子和不可以控制的数量因子同时影响实验结果的情况,这时就需要采用协方差分析的统计处理方法,将质量因子与数量因子(也称协变量)综合起来加以考虑.比如,要研究3
5、种肥料对苹果产量的实际效应,而各棵苹果树头年的“基础产量”不一致,但对试验结果又有一定的影响。要消除这一因素带来的影响,就需将各棵苹果树第1年年产量这一因素作为协变量进行协方差分析,才能得到正确的实验结果.a = —1 1 2 -2 3 1 4 0 3for i=1:size(a,2) for j=1:size(a,2) c(i,j)=sum((a(:,i)—mean(a(:,i)))。*(a(:,j)—mean(a(:,j))))/(size(a,1)
6、—1); end endc= 10.3333 —4。1667 3。0000 -4。1667 2.3333 -1。5000 3.0000 -1。5000 1。0000 c为求得的协方差矩阵,在matlab以矩阵a的每一列为变量,对应的每一行为样本。这样在矩阵a中就有3个列变量分别为a(:,1),a(:,2),a(:,3)。个人收集整理勿做商业用途 在协方差矩阵c中,每一个元素c(i,j)为对第i列与第j列的协方差,例如c(1,2)=—4.1667为第一列与第二列的协方差。 拿c(1,2)的求解过程来说 c(1,2)=sum
7、((a(:,1)—mean(a(:,1)))。*(a(:,2)—mean(a(:,2))))/(size(a,1)-1); 1。 a(:,1)—mean(a(:,1)),第一列的元素减去该列的均值得到 -1.3333 —2。3333 3。66672, a(:,2)—mean(a(:,2)),第二列的元素减去该列的均值得到 —0。3333 1。6667 -1.33333,再将第一步与第二部的结果相乘 -1.3333 -0.3333 0.4444 —2。3333 。* 1.6667 = -3。8889
8、 3。6667 —1.3333 -4。8889 4,再将结果求和/size(a,1)-1得-4.1667,该值即为c(1,2)的