欢迎来到天天文库
浏览记录
ID:40224774
大小:734.00 KB
页数:36页
时间:2019-07-27
《第 三章 概率论与数理统计基础(概率分布的特征)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、概率论与数理统计基础(二)概率分布的数字特征1一、概率分布的数字特征1、期望考虑这样一个例子:设射击手甲与乙在同样条件下射击,其命中环数是一个随机变量。假设根据历史记录得到他们分别有下面的命中概率分布表。试问:如何评定甲、乙的射击水平。X甲10987650P(X)0.50.20.10.10.050.050Y乙10987650P(Y)0.10.10.10.10.20.20.22假设甲射击手发了100颗子弹由于他命中10环的概率为0.5,那么约有50次命中10环,同理,约有20次命中9环,……平均命中环数为:同理可得E(Y)=5
2、.63期望是集中趋势的度量,反映平均意义⑴离散型随机变量X的期望值如果X取有限个值x1,x2,…xn如果X取无限个值x1,x2,…xn…4例子随机抛一个骰子,求朝上一面的点数的期望值。E(X)=1/6+2/6+3/6+4/6+5/6+6/6=21/6=3.5点数x概率p(x)x.p(x)11/61/621/62/631/63/641/64/651/65/661/66/65在电脑/打印机销售一例中,电脑销售量的期望值为E(X)=0*0.08+1*0.12+2*0.24+3*0.24+4*0.32=2.60同理,可得打印机销售量
3、的期望值为E(Y)=0*0.11+1*0.16+2*0.23+3*0.27+4*0.23=2.35.6⑵连续型随机变量X的期望值7⑶随机变量函数的期望离散型:连续型:8⑷条件期望9例子:在个人电脑/打印机一例中,计算E(Y
4、X=2).即求每天售出2台电脑的条件下,销售打印机的条件期望。E(Y
5、X=2)=0*f(Y=0
6、X=2)+1*f(Y=1
7、X=2)+2*f(Y=2
8、X=2)+3*f(Y=3
9、X=2)+4*f(Y=4
10、X=2)=1.875(条件期望)注:f(Y=1
11、X=2)=E(Y)=0*0.11+1*0.16+2*0.2
12、3+3*0.27+4*0.23=2.35(非条件期望)结论:条件期望一般不等于非条件期望。当然,如果两个变量相互独立,那么条件期望与非条件期望相同。10⑸二元随机变量函数的情况(多元概率分布的期望值)Z=XY11例子:继续个人电脑/打印机销售一例。E(XY)==1*1*0.05+1*2*0.06+1*3*0.02+1*4*0.01+…4*0*0.01+4*1*0.01+4*2*0.01+4*3*0.05+4*4*0.15=7.06(取每一对X和Y的值,乘以它们的联合概率,然后加总)12⑹期望的性质E(C)=CC为常数E(CX
13、)=CE(X)E(X+C)=E(X)+CE(X+Y)=E(X)+E(Y)若X与Y相互独立,则E(XY)=E(X)E(Y)132、方差期望值仅仅给出了随机变量的重心(或取值的平均程度),但没有表明单个值在均值附近是如何分布或分散的。度量这种分散程度的最常用工具就是方差(variance).考察两组成绩甲组:40,50,60,70,80,90,100乙组:60,60,70,70,70,80,80甲组平均成绩:70乙组平均成绩:7014方差是离散程度的度量1516方差的性质17变异系数由于标准差(或方差)与度量单位有关,因此如果度
14、量单位不同,很难对两个或多个标准差进行比较。为了解决这个问题,引入变异系数。无量纲(纯数值)例题:期中考试中,A班实行百分制,其平均分为80分,标准差为10,B班实行10分制,平均分为7.8,标准差为1.2,哪个班的成绩更好呢?18Xf(X)A均值大小的图示判别B19Xf(X)AB小方差大方差方差大小的图示判别203、协方差协方差是一种特殊形式的期望值,度量两个随机变量如何共同变动。如果两个变量同方向变动,则协方差为正;如果两个变量反方向变动,则协方差为负;如果变量之间不存在线性关系,则协方差为0.21例子:再一次回到个人电
15、脑/打印机销售一例。计算电脑销售量(X)和打印机销售量(Y)的协方差。COV(X,Y)==7.06-2.60*2.35=0.95表明电脑销售量和计算机销售量是正相关的。22协方差的性质23度量两个随机变量的线性关系4、相关系数24相关系数的性质即若两个变量的相关系数为0,并不意味这它们相互独立,它们可能存在非线性关系。如Y=X2.25正线性相关负线性相关非线性相关不相关典型相关关系图示26描述概率分布形状的数字特征5、偏度(S)和峰度(K)对称右偏左偏27低峰尖峰常峰28偏度和峰度的计算公式S如果为正,则概率密度函数为正偏或
16、右偏S如果为负,则概率密度函数为负偏或左偏K<3称为低峰,K>3称为高峰,K=3称为常峰296、样本数据所体现的随机变量的数字特征引例:要想了解某一时点上居住在湘潭所有居民的平均收入,显然需要知道湘潭居民总体的信息。但实际上很难收集到总体中每个成员的信息(收入水平)。实践中所能做到的是从总
此文档下载收益归作者所有