资源描述:
《概率论与数理统计第16讲》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、一、协方差与相关系数的概念及性质二、相关系数的意义第三节协方差及相关系数三、小结问题对于二维随机变量(X,Y):已知联合分布边缘分布对二维随机变量,除每个随机变量各自的概率特性外,相互之间可能还有某种联系.问题:是用一个怎样的数去反映这种联系?一、协方差与相关系数的概念及性质1.问题的提出数反映了随机变量X,Y之间的某种关系.2.定义由协方差定义可知协方差也是随机变量函数的数学期望值.协方差的大小在一定程度上反映了X和Y相互之间的关系,但它还受X与Y本身度量单位的影响.例如:Cov(kX,kY)=k2C
2、ov(X,Y)为了克服这一缺点,对协方差进行标准化,这就引入了相关系数.3.说明(3)对于任意的两个随机变量X和Y,有若(X,Y)为离散型,若(X,Y)为连续型,4、协方差的计算方法(1)利用定义计算(2).计算公式证明5.协方差的性质(5)Cov(X,C)=0.(7)证明:对任何实数t,上式(asafunctionoft)成立的充要条件是6.相关系数的性质证明:(1)由于(2)令则得到从而即重新整理得类似证明当,结论也成立。7.相关系数的意义考虑以X的线性函数a+bX来近似表示Y,以(平)均(平)方误
3、差e=E{[Y-(a+bX)]2}来衡量以a+bX近似表示Y的好坏程度,e值越小表示a+bX与Y的近似程度越好.用微积分中求极值的方法,求出使e达到最小时的a,b.相关系数刻划了X和Y间“线性相关”的程度.以a+bX近似的表示Y选择a,b,使e(a,b)达到极小。即这样求出的最佳逼近为L(X)=a0+b0X这样求出的最佳逼近为L(X)=a0+b0X这一逼近的剩余是若=0,Y与X无线性关系;Y与X有严格线性关系;若可见,若0<
4、
5、<1,
6、
7、的值越接近于1,Y与X的线性相关程度越高;
8、
9、的值越接近于0,Y与
10、X的线性相关程度越弱.E[(Y-L(X))2]=D(Y)(1-)此时,称X和Y不相关.(1)不相关与相互独立的关系2.注意相互独立不相关(2)不相关的充要(等价)条件例1(解题过程自己看课本P132例2.)结论例2设~U(0,2),X=cos,Y=cos(+),是给定的常数,求cov(X,Y),XY.解解例3例3例3三、小结协方差与相关系数的定义协方差的性质相关系数的意义第四节矩、协方差矩阵矩的定义协方差矩阵的定义n维正态变量的性质小结一、矩(定义):定义设X和Y为随机变量,k,l为正整数
11、,2.若存在,称之为X的k阶中心矩。由定义可见X的数学期望E(X)是X的一阶原点矩;X的方差D(X)是X的二阶中心矩;协方差cov(X,Y)是X和Y的二阶混合中心矩.2.说明二、协方差矩阵(定义)协方差矩阵的应用例:二维正态分布:三、n维正态分布的重要性质n维正态变量(X1,X2,…,Xn)的每一个分量Xi(i=1,2,…,n)都是正态变量;反之,若X1,X2,…,Xn都是正态变量,且相互独立,则(X1,X2,…,Xn)是n维正态变量.注:性质中若不具有独立性,则反之不一定成立.2.n维正态变量(X1,
12、X2,…,Xn)服从n维正态分布的充要条件是X1,X2,…,Xn的任意线性组合l1X1+l2X2+…+lnXn均服从一维正态分布(其中l1,l2,…,ln不全为零).3.若(X1,X2,…,Xn)服从n维正态分布,设Y1,Y2,…,Yk是Xj(j=1,2,…,n)的线性函数,则(Y1,Y2,…,Yk)也服从k维正态分布.注:这一性质称为正态变量的线性变换不变性.4.设(X1,X2,…,Xn)服从n维正态分布,则"X1,X2,…,Xn相互独立"等价于"X1,X2,…,Xn两两不相关".例解:四、小结1)矩
13、的定义2)协方差矩阵.3)n维正态分布的性质.例1:对随机变量X、Y而言,已知2X+3Y=7,则例3:设随机变量X与Y的相关系数为0.9,若则Y与Z的相关系数为____.例2:已知则X与Y的相关系数为______.例.设随机变量X与Y的相关系数为0.9,若则Y与Z的相关系数为解:因此,由题设条件知于是例4证明: