资源描述:
《概率论与数理统计ppt教学课件第13讲》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、概率论与数理统计第十三讲北京工业大学应用数理学院§4.3协方差与相关系数对于二维随机向量(X,Y),除了其分量X和Y的期望与方差之外,还有一些数字特征,用以刻画X与Y之间的相关程度,其中最主要的就是下面要讨论的协方差和相关系数。定义1:若E{[X-E(X)][Y-E(Y)]}存在,则称其为X与Y的协方差,记为Cov(X,Y),即4.3.1协方差Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}.(1)(3).Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y);(1).Cov(X,Y)=Co
2、v(Y,X);协方差性质(2).设a,b,c,d是常数,则Cov(aX+b,cY+d)=acCov(X,Y);(4).Cov(X,Y)=E(XY)-[E(X)][E(Y)],(5).Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y).当X和Y相互独立时,Cov(X,Y)=0;若X1,X2,…,Xn两两独立,则性质(5)可推广到n个随机变量的情形:协方差的大小在一定程度上反映了X和Y相互间的关系,但它还受X和Y本身度量单位的影响。例如:Cov(aX,bY)=abCov(X,Y).为了克服这一缺点,
3、对协方差进行标准化,这就引入了相关系数。4.3.2相关系数为随机变量X和Y的相关系数。定义2:设Var(X)>0,Var(Y)>0,则称在不致引起混淆时,记为。相关系数性质证:由方差与协方差关系,对任意实数b,有0≤Var(Y-bX)=b2Var(X)+Var(Y)-2bCov(X,Y),令则有Var(Y-bX)=由方差Var(Y)>0,知1-ρ2≥0,所以
4、ρ
5、≤1。由于当X和Y独立时,Cov(X,Y)=0.请看下例:(2).X和Y独立时,ρ=0,但其逆不真;但ρ=0并不一定能推出X和Y独立。所以,证明:例
6、1:设(X,Y)服从单位D={(x,y):x2+y2≤1}上的均匀分布,证明:XY=0。所以,Cov(X,Y)=E(XY)-E(X)E(Y)=0.同样,得E(Y)=0,此外,Var(X)>0,Var(Y)>0.所以,XY=0,即X与Y不相关。但是,在例3.6.2已计算过:X与Y不独立。存在常数a,b(b≠0),使P{Y=a+bX}=1,即X和Y以概率1线性相关。(3).
7、ρ
8、=1但对下述情形,独立与不相关是一回事:前面,我们已经看到:若X与Y独立,则X与Y不相关;但由X与Y不相关,不一定能推出X与Y独立。
9、若(X,Y)服从二维正态分布,则X与Y独立的充分必要条件是X与Y不相关。定义1:设X是随机变量,若E(Xk)存在(k=1,2,…),则称其为X的k阶原点矩;若E{[X-E(X)]k}存在(k=1,2,…),则称其为X的k阶中心矩。§4.3矩与协方差矩阵4.4.1矩易知:X的期望E(X)是X的一阶原点矩,方差Var(X)是X的二阶中心矩。定义2:设X和Y是随机变量,若E(XkYm)存在(k,m=1,2,…),则称其为X与Y的k+m阶混合原点矩;若E{[X-E(X)]k[Y-E(Y)]m}存在(k,m=1,2,…
10、,则称其为X与Y的k+m阶混合中心矩。4.4.2协方差矩阵将随机向量(X1,X2)的四个二阶中心矩排成一个2×2矩阵,则称此矩阵为(X1,X2)的方差与协方差矩阵,简称协方差阵。类似地,我们也可定义n维随机向量(X1,X2,…,Xn)的协方差阵:若随机向量的所有的二阶中心矩为(X1,X2,…,Xn)的协方差阵。存在,则称矩阵f(x1,x2,…,xn)则称X服从n元正态分布。其中C是(X1,X2,…,Xn)的协方差阵,
11、C
12、是C的行列式,表示C的逆矩阵,X和是n维列向量,表示X的转置。设=(X1,X2,…,Xn
13、)是一个n维随机向量,若其概率密度n元正态分布的几条重要性质:(1).X=(X1,X2,…,Xn)'服从n元正态分布对一切不全为0的实数a1,a2,…,an,a1X1+a2X2+…+anXn服从正态分布。(2).若X=(X1,X2,…,Xn)'服从n元正态分布,Y1,Y2,…,Yk是Xj(j=1,2,…,n)的线性组合,则(Y1,Y2,…,Yk)'服从k元正态分布。这一性质称为正态变量的线性变换不变性。(3).设(X1,X2,…,Xn)服从n元正态分布,则“X1,X2,…,Xn两两不相关”。“X1,X2,…,
14、Xn相互独立”等价于例2:设随机变量X和Y相互独立,且X~N(1,2),Y~N(0,1)。求Z=2X-Y+3的概率密度。知Z=2X-Y+3服从正态分布,且解:由X~N(1,2),Y~N(0,1),且X与Y相互独立,Var(Z)=4Var(X)+Var(Y)=8+1=9,E(Z)=2E(X)-E(Y)+3=2-0+3=5,故,Z~N(5,32).Z的概率密度为小结本讲首先介绍二维随机向量(X,Y)的分