资源描述:
《概率第三章》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
第三章随机变量的数字特征本章问题引入:两射击运动员的射击水平相近,在相同条件下进行射击,以什么标准来衡量出他们成绩的好与坏呢?又如某厂家在决定购买某品牌的集成电路板时,既需要考虑该品牌集成线路板的平均使用寿命,又要关心单板寿命与平均寿命的偏离程度,以确保自己产品的质量。某商场要依据天气预报来决定节日是在商场内还是在商场外搞促销活动。统计资料表明,每年国庆节商场内的促销活动可获得经济效益4万元;在商场外的促销活动如果不遇有雨天气可获经济效益13万元,如果促销活动中遇到有雨天气则带来经济损失4万元。9月30日气象台预报国庆节当地有雨的概率是45%,商场应该如何选择促销方式?又如,有关部门要通过了解某地区中学入学新生的体重、身高情况来分析这些学生的身体发育状况,需要从这些学生中抽取一部分学生,对他们的体重、身高的数据进行统计处理。怎样抽取一部分学生才能较好地反映全体学生的情况?怎样估计学生身体发育状况的平均水平?怎样估计学生身体发育的总体分布状况?以上问题涉及到表示随机变量的某些特征的数值,虽然不能完整地描述随机变量,但能描述随机变量某些方面的重要特征.我们称其为随机变量的数字特征,它在理论和实践上都具有重要的意义.本章将介绍随机变量的常用数字特征:数学期望、方差、相关系数和数字特征的应用.
13.1数学期望3.1.1离散型随机变量的数学期望我们知道离散型随机变量的分布列全面地描述了这个随机变量的统计规律,但在许多实际问题中,这样的“全面描述”有时并不方便.例如,已知在一个同一品种的母鸡群,一只母鸡的年产蛋量是一个随机变量,如果要比较两个品种母鸡的年产蛋量,通常只要比较两个品种母鸡的年产蛋量的平均值就可以了.平均值大就意味着这个品种的母鸡的产蛋量高,当然是“较好”的品种,这时如果不去比较它的平均值,而只看它的分布列,虽然“全面”,却使人不得要领,既难以掌握,又难以迅速作出判断.这样的例子可以举出很多.例如:要比较不同班级的学习成绩通常就是比较考试中的平均成绩;要比较不同地区的粮食收成,一般也只要比较平均亩产量等.可见平均值在实际中的重要.现在,先看一个例子.【例1】为测定一批种子发芽所需的平均天数,随机选取100粒种子进行发芽试验,其中发芽的有98粒,有关种子的发芽情况见表3-1.试求种子发芽所需的平均天数.发芽天数1 2 3 456发芽种子数11 21 37 20 9 2频率11/9821/9837/9820/989/982/98
2解98粒种子发芽所需的平均天数为这里需要指出的是,虽然98粒种子发芽分别用了1—6由于每天发芽的种子数并不相同,因此,98粒种子发芽所需的平均天数不再是(1+2+3+4+5+6)÷6=3.5。这是因为,随机变量取值的平均值既与它取哪些值有关,又与每个可能取值发生的概率有关。而例1中随机变量(发芽所需天数)取每个值(1,2,3,4,5,6)的可能性是不相等的,因此算术平均值已不能反映随机变量取值的平均值。从例1的计算中可以发现,这个平均值应该是随机变量的一切可能取值与其相应的概率乘积的总和,也就是以概率为权重的加权平均值。这便是概率论中的重要概念——数学期望。定义1设离散型随机变量X的分布列为,则称和式为离散型随机变量X的数学期望,记作=(3-1-1)或记EX,即数学期望等于离散型随机变量的所有可能取值与其对应概率乘积之和.
3【例2】设随机变量X的分布律为求E(X).解【例3】甲乙两台机床日生产能力相当,一天生产废品件数的概率分布见表3—2,问哪一台机床的性能好些?解甲机床日产废品的平均数为0.9件,少于乙机床日产废品的平均数1.3件,故甲机床的性能好些.X012P0.30.50.2甲机床乙机床01230123p0.30.50.20p0.30.50.20
4【例4】某家电商场对某品牌冰箱采用先使用后付款的方式进行促销.若记使用寿命为X(以年计),规定:设寿命X服从指数分布,概率密度为试求该商场该品牌冰箱的平均售价。解先求出寿命X落在各个时间区间的概率,按题意有
5一台冰箱收费Y的分布律为于是E(Y)=1500×0.0952+2000×0.0861+2500×0.0779+3000×0.7408≈2732(元)即该品牌冰箱每台平均售价约为2732元.下面求解几个常用的离散型随机变量的数学期望.1.二点分布二点分布的分布律为X01Ppq其中,所以二点分布的数学期望2.二项分布二项分布的分布律为,所以=Y15002000250030000.09520.08610.07790.7408
6令;当k=1时,,当k=n时,,于是有即二项分布的数学期望E(X)=np.二项分布的期望是np,直观上也比较容易理解这个结果.因为X是n次试验中某事件A出现的次数,它在每次试验时出现的概率为p,那么次试验时当然平均出现了np次.3.泊松分布泊松分布的分布律为所以令,当k=1时,,则即泊松分布的参数就是随机变量的数学期望
73.1.2连续型随机变量的数学期望对于连续型随机变量数学期望概念的引入,大体上可以在离散型随机变量数学期望基础上,沿用高等数学中生成定积分的思路,改求和为积分即可.定义2设随机变量,.如果积分绝对收敛,称积分的值为随机变量的数学期望.记为(3-1-2)【例5】设随机变量X的密度函数为.解利用分部积分法可得:E(x)=0.下面我们求解几种常见的连续型随机变量的数学期望.1.均匀分布均匀分布的密度函数为,所以即均匀分布的数学期望.
82.指数分布指数分布的密度函数为,所以=.即指数分布的数学期望.3.正态分布如果,则E(X)=设,则,于是上式右端第一项的被积函数为奇函数,它在对称区间上的积分为0,第二项的被积函数为正态分布的密度函数,所以其在上的积分值为1,于是.即正态分布的参数恰好是随机变量的数学期望.可见,数学期望作为体现集中位置的数字特征,往往要比分布本身更能直观地显示随机变量取值的平均状态这一特征.从而再次说明了引入数字特征的必要.
93.1.3随机变量函数的数学期望1.X为离散型随机变量定理设g(x)是连续函数,Y是随机变量X的函数:Y=g(x).(1)设X是离散型随机变量,其分布律为若收敛,则有(3-1-3)(2)设X是连续型随机变量,概率密度为f(x),若积分,则有(3-1-4)从期望定义不难理解这个定理结论的正确性。例如,对式(3-1-3),把g(X)看成一个新随机变量,那么当X以概率取值时,g(X)以概率取值,因而它的期望当然应该是,对于式子(3-1-4)也一样.上面定理的重要性在于它提供了计算随机变量X的函数g(X)的期望的一个简便方法,不需要先求g(X)的分布,直接利用X的分布.因为有时候求g(X)的分布并不那样容易.定理也可以推广到两个随机变量的函数的情况.例如,对于离散型情况,设,则有(3-1-5)对于连续型情况,设f(x,y)是概率密度,则有(3-1-6)
10【例6】已知随机变量解【例7】设(X,Y)的概率分布如下:求的期望.解由式(3-1-5)得:
11【例8】设风速X是一个随机变量,在[0,a]上服从均匀分布,而收音机的两翼受到的压力Y与风速X的平方成正比,解X的密度函数为3.1.4数学期望的性质数学期望的性质主要有(假设E(X),E(Y)存在):1.若c为常数,则E(c)=c;2.若c为常数,则E(cX)=cE(X);3.对任意的随机变量X与Y,有E(X+Y)=E(X)+E(Y);(此性质可推广到有限个情形)4.若X与Y相互独立E(XY)=E(X)E(Y).(此性质可推广到有限个情形)
12【例9】将n个求放入M个盒子中,设每个球落各个盒子的可能性相等,求有球的盒子数X的期望.解引入随机变量则,由期望的性质有:只须求出.每个随机变量都服从两点分布,由于落入各个盒子的可能性相等,均为,则对于第i个盒子,一个球不落入这个盒子的概率为个球都不落入这个盒子的概率为,即从而=这个例子有着丰富的实际背景.例如,把M个盒子看成M个“银行自动取款机”,n个球看成个“取款人”,设每个人到哪个取款机取款是随机的,那么E(X)就是处于服务状态的取款机的平均个数.
13习题3.11.设随机变量X的概率分布为,求E(X).2.袋中有3只黑球1只白球,今从中一个一个不放回地摸取,直到摸出白球为止.若记摸取次数为X,试求E(X).3.设随机变量X~B(100,0.5),若Y=2X+3,试求E(X),E(Y).4.设随机变量X的概率密度为试求E(X).5.设随机变量X的概率分布为
143.2方差3.2.1方差的定义数学期望这一数字特征固然重要,但是在某种情况下只有数学期望,常常不足以显示随机变量取值规律的另外基本特征.【例1】已知射手甲命中环数的分布列为;射手乙命中环数的分布列为.试据此对射手甲、乙的射击水平作出评判.解易知,他们的平均命中率是相同的,即.如果在竞技比赛中,无评判细则可循,那么据此可断言他们有相同的射击水平而并列于同一名次.但是应该指出,甲、乙射手射击水平的差异确是存在的.从分布列看,甲的命中环数分散,显得不很稳定,相比之下乙要稳定一些.为了定量描述这样的差异性而引入第二类数字特征,即方差.
15定义1对于随机变量,如果存在,则称它为随机变量的方差,记为(3-2-1)方差的算术平方根称为均方差或标准差,记为均方差要说明的问题,原则上与方差是一致的,所不同的是:方差毋需开方,在统计分析中常被采用,标准差与随机变量有相同的量纲,在工程技术中广为使用.根据定义1及上节之定理,在离散型场合下,其分布律为(3-2-2)在连续型场合下,其密度函数为P(x),则可得(3-2-3)可见,随机变量的方差是一个非负数,离散型场合下由它的分布列惟一确定,连续型场合下由其分布密度惟一确定.较大方差对应着的随机变量取值与它的数学期望有较大偏离,即随机变量取值比较分散.反之,则表示随机变量取值比较集中.因此,方差是衡量随机变量取值集中(分散)程度的数字特征.
16运用上面的公式计算方差有时是不方便的.为此,引入简化公式(3-2-4)事实上【例2】设离散型随机变量的概率分布为,求D(X).解.【例3】设X是连续型随机变量,其密度函数为求D(X).解所以
17【例4】设随机变量X服从参数为解由于X的密度函数为3.2.2方差的性质方差具有以下性质(假设D(X),D(Y)存在):若C为常数,则D(C)=0;2.若C为常数,则D(CX)=3.若X与Y相互独立,有D(X+Y)=D(X)+D(Y);(此性质可推广到有限个情形)
18【例5】证明根据数学期望与方差的性质有这里E(X)是常数,X与E(X)是相互独立的。由于,故将叫做随机变量X的标准化随机变量。【例6】设随机变量相互独立,且求的期望和方差.解使用期望和方差的性质可得
19为方便起见,我们把常用分布的期望和方差列成下表3-3分布名称分布或概率密度均值方差二点分布二项分布泊松分布均匀分布指数分布正态分布
20习题3.21、设随机变量X的分布律为X~,试求D(X)。2、有3只废晶体管与9只好晶体管混在一起,安装机器时,从中任取一个,如果是废品则不放回,求在取得合格品以前取出的废品数的均值与方差.3、设随机变量X的概率密度为求X的数学期望与方差。4、已知X~N(1,2)Y~N(2,1),且X与Y相互独立,求D(X-Y)。
213.3协方差与相关系数对于二维随机变量(X,Y),除了它的分量X,Y的期望和方差这些数字特征以外,还有用以刻画X与Y之间的相关程度的数字特征,其中最主要的就是协方差与相关系数.3.3.1协方差定义1设(X,Y)为二维随机变量,若存在,则称它为随机变量X与Y的协方差,记为或,即==特别地,即方差是协方差的特例.协方差可以帮助我们了解两个随机变量之间的关系。如果X取值比较大时(如X大于其期望),Y也取值比较大(也大于其期望),这时;则进X取值比较小时(如X小于其期望),Y也取值比较小(也小于其期望),这时也有,这样就有协方差>0.可见正的协方差表示两个随机变量倾向于同时取较大值或同时取较小值;反过来,如果X取值比较小而Y取值反而比较大时,或当X取值比较大而Y取值比较小时,则必有<0.可见负的协方差反映了两个随机变量有相反方向变化的趋势.这里需要说明的是协方差定义为期望,因此,上面说的两个随机变量的变化趋势是在平均意义上而言的.
22协方差具有以下性质:(1)=;(2);(3).协方差的计算常采用下面的公式:3.3.2相关系数协方差在一定程度上反映两个变量之间的相互关系,但它的值与随机变量所取的单位有关。为了不受变量单位的限制,我们引进相关系数的概念.定义2设(X,Y)为二维随机变量,若都存在,则称为随机变量X与Y的相关系数,记为,即=相关系数与协方差之间相差一个倍数,相关系数是标准尺度下的协方差.协方差依赖于X与Y的度量单位,如果将X与Y分别除以各自的标准差,则协方差就是相关系数.这样能更好地反映X与Y之间的关系,而不受所用的度量单位的影响.
23可以证明,.当的取值成线性关系();当时,X与Y不(线性)相关.越接近于1时,X与Y的取值的线性近似程度越高;反之,越接近于0,X与Y的取值的线性近似程度越低.注意:当X与Y独立时,有.而时,不一定独立,因此不相关和独立是两个概念,二者不能混淆.但作为特例,二维正态分布(X,Y)中X与Y相互独立与不相关则是等价的(读者可自己证明).【例1】对于二维随机变量(X,Y),设X服从(-1,1)上的均匀分布,且.证明=0.证由于均匀分布的期望E(X)=0可得:而均匀分布的密度函数为因此 所以=0.另外,由于均匀分布的方差而所以 .于是.但由于,显然X与Y不相互独立.
24习题3.31.设(X,Y)的概率密度为求.2.设.3.设3.4大数定律与中心极限定理随机现象的统计规律性是在相同条件下进行大量重复试验时呈现出来的。例如,在概率的统计定义中,指明一个事件发生的频率具有稳定性,即频率趋于事件的概率,这里是指试验的次数无限增大时,在某种收敛意义下逼近某一定数。这就是最早的大数定律。在长期实践中人们发现,一个随机变量的次观测值的平均值稳定在它的数学期望附近.有许多随机变量,它们受大量相互独立的随机因素的影响,而每个因素所起的作用是微小的,这时,这些随机变量近似地服从正态分布。本节将在理论上解释这些现象.
253.4.1切比雪夫不等式定理1设分别是随机变量X的均值和方差,则对于任意给定的正数,有证明仅就连续情况加以证明.设X的密度函数为f(x),则有两边同乘以得:这个不等式称为切比雪夫不等式。它说明方差D(X)越小,随机变量取值远离期望E(X)的概率就越小,即X的取值越集中在E(X)的附近.
263.4.2贝努利大数定律定理2设X是n次独立试验中事件A发生的次数,p(0
273.4.3中心极限定理在概率论中,中心极限定理就是研究在一定条件下,大量独立随机变量和的分布以正态分布为极限的一类定理.这里介绍其中两个重要定理(不加证明).定理3(隶莫弗-拉普拉斯定理)设,则对于任意实数x,有此定理表明,服从参数为n,p的二项分布的随机变量X,当n充分大时,它的标准量(这里np为X的均值E(X),为X的均方差)近似地服从标准正态分布N(0,1),而X本身近似地服从正态分布更一般的情况有:定理4(独立同分布中心极限定理)设随机变量相互独立地服从同一分布,且具有数学期望和方差:,则对任意的实数x有
28此定理表明,相互独立且服从同一分布的随机变量,其和的标准化量在n充分大时,近似地服从标准正态分布,本身也就必然近似服从正态分布.【例1】设有30个电容,使用规则是:损坏,立即使用;损坏,立即使用,依此类推。设的寿命服从的指数分布,求30个电容使用的总时间T走进超过400h的概率.解用表示第i个电容的寿命,从而.已知的寿命相互独立且均服从参数不能的指数分布,故其均值,方差,于是有从而由定理4有=即30个电容使用的总时间超过400h的概率约为3.4%
29习题3.41.已知正常成年男性每毫升的血液中,含白细胞平均数是7300,均方差是700,使用切比雪夫不等式估计每毫升血液中含白细胞数在5200到9400之间的概率。2.设随机变量X服从参数为的泊松分布,使用切比雪夫不等式证明。3.设一批产品的强度服从期望为14,方差为4的分布。每箱中装有这种产品100件,问:(1)每箱产品的平均强度超过14.5的概率是多少?(2)每箱产品的平均强度超过14的概率是多少?4.计算机在进行数字计算时,遵从四舍五入的原则。为简单计,现在对小数点后面第一位进行舍入运算,则误差X可以认为服从[-0.5,0.5]上的均匀分布.若在一项计算中进行了100次数字计算,求平均误差落在区间上的概率。5.某市保险公司开办一年人身保险业务。被保险人每年需交付保险费160元,若一年内发生重大人身事故,其本人或家属或获得2万元赔金。已知该市人员一年内发生重大人身事故的概率为0.005,现有5000人参加此项保险,问保险公司一年内从此项业务所得到的总收益在20万到40万元之间的概率是多少?
30本章学习指导一、教学要求1、理解随机变量的期望和方差的定义,并会计算随机变量的期望和方差以及随机变量函数的期望.2、要记忆和熟练运用方差的简单性质.二、考点提示随机变量的数字特征.三、疑难解析随机变量的数字特征的求法解题程序:(1)由题意正确写出随机变量的分布律或分布密度(有时不易写出分布密度,先写出分布函数);(2)利用离散型或连续型的计算公式或,计算常用公式为:1.为什么把随机变量的数学期望和方差叫做随机变量的数字特征?答随机变量的数学期望反映取值的集中位置,方差反映对其期望的集中程度.越小,的取值越集中,,则,因此,粗略地反映了的取值的分布情况.另外,一些应用广泛的重要分布(如二项分布,泊松分布,正态分布)的分布律或概率密度,完全由它们的期望和方差所确定,因此,人们习惯地把随机变量的期望和方差叫做随机变量的数字特征.
312.随机变量的数字特征就是指期望和方差吗?答不是。所谓随机变量的数字特征,是指刻画随机变量及其分布规律的某些特征的数值。除了期望和方差以外,原点矩、中心矩、协方差、相关系数等等,均叫做随机变量的数字特征.3.假设公共汽车起点站于每时的10分,30分,50分发车,其乘客不知发车的时间,在每小时内任一时刻到达车站是随机的,求乘客到车站等车时间的数学期望.解由于乘客在每小时内任一时刻到达车站是随机的,因此可以认为乘客到达车站的时刻为[0,60]中的均匀分布,于是其分布密度为显然,乘客等候时间是其到达时刻的函数,可用如下公式表示:.
32复习题三一、填空题:1、设离散型随机变量的取值是在两次独立试验中事件A发生的次数,如果在这次试验中事件发生的概率相同,并且已知,则=.2、一袋中有3个红球5个白球,从中有放回地取4次,每次取一球,若表示取到的红球次数,则服从分布,的概率函数为,平均有次取到红球.3、若随机变量,,且,则.4、设随机变量服从参数为2的指数分布,服从参数为4的指数分布,则=.5、掷n枚骰子,则出现的点数之和的数学期望.二、选择题:1、现有10张奖券,其中8张为2元,2张为5元,今某人从中随机地无放回地抽取3张,则此人得到奖金的数学期望().A.6B.12C.7.8D.92、人的体重,,,10个人的平均体重记为,则()正确.A.B.C.D.
333、设随机变量的期望,方差及都存在,则一定有().A.B.C.D.4、如果随机变量,则=().A.B.C.D.5、已知离散型随机变量的可能取值为:,且,,则对应于的概率为为().A.B.C.D.三、解答题:1、已知随机变量有分布列试求:.2、已知10件产品中有8件是一等品,2件是二等品。每次从中任意抽出1件,抽后不放回.试求抽到一等品时的平均抽取次数.3、对球的直径作测量,其值服从[a,b]上的均匀分布,求球的体积的平均值。4、对目标进行射击,直到射中为止,如果每次射击的命中率为p,求射击次数的数学期望.
345、某保险公司规定,如果在一个保险周期内事件A发生,则向投保人赔付a元。以往的统计资料显示,一个保险周期内事件A发生的概率为p,保险公司为了使收益不低于a的10%,问他们至少要向投保人收取多少保险金?(提示:设保险公司赔款数为X,则客户应交保险金E(X)+0.1a)6、对于随机变量的下述分布密度,分别求.(1)(2)7、设随机变量X的概率密度为且E(X)=0.6,求(1)常数a和b;(2)X的标准差。8、某品牌袋装奶粉规定每袋净重1000g,标准差为30g,每箱装有100袋。计算一箱该品牌奶粉净重不足99400g的概率。