欢迎来到天天文库
浏览记录
ID:20471367
大小:309.50 KB
页数:49页
时间:2018-10-13
《一些重要的概率分布》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、一些重要的概率分布§1、正态分布§2、样本均值的抽样分布或概率分布§3、x²分布§4、t分布§5、F分布§6、x²分布、t分布、F分布与正态分布的关系§1、正态分布1.1什么是正态分布?对于连续型随机变量而言,正态分布是最重要的一种概率分布,其形状似“钟型”。经验表明:对于其值依赖于众多微小因素且每一因素均产生微小的或正或负影响的连续型随机变量来说,正态分布是一个相当好的描述模型。如身高、体重、考试成绩等。为了方便,通常用:表示随机变量X服从正态分布。符号~表示随机变量服从什么样的分布;N表示正态分布;,²为正态
2、分布的(总体)均值(或期望)和方差。X是一个连续型随机变量,可在区间(-∞,+∞)内任意取值。--2268%(近似)3-395%(近似)99.7%(近似)正态曲线下的区域示意图1.2正态分布的性质:⑴正态分布曲线以均值为中心,对称分布。⑵正态分布的概率密度函数呈中间高、两边低,在均值处达到最高,向两边逐渐降低,即随机变量在远离均值处取值的概率逐渐变小。⑶正态曲线下的面积约有68%位于±两值之间;约有95%面积位于±2之间;约有99.7%的面积位于±3之间。这些区域可用作概率的度量。⑷正态
3、分布可由两个参数,²来描述,即一旦知道,²的值,就可以根据附录表查到随机变量X落于某一区间的概率值。⑸两个(或多个)正态分布随机变量的线性组合仍服从正态分布。该性质很重要,解释如下:⑹正态分布的偏度为0,峰度为3。令:假定X和Y相互独立,设a、b为常数,考虑线性组合:W=aX+bY则有:其中,例:令X表示在曼哈顿非商业区一花商每日出售玫瑰花数量,Y表示在曼哈顿商业区一花商每日出售玫瑰花的数量,假定X和Y均服从正态分布,且相互独立。已知:X~N(100,64),Y~N(150,81),求两天内两花商出售玫瑰花数
4、量的期望和方差。W=2X+2Y根据上述公式,得:E(W)=2E(X)+2E(Y)=500Var(W)=4Var(X)+4Var(Y)=580因此,W服从均值为500,方差为580的正态分布,即W~N(500,580)1.3标准正态分布由于期望和方差的不同,正态分布之间会存在一定的区别(见下图),如何将其简单化,从而引入标准正态分布。12不同均值,同方差的两个正态分布图121=2不同均值,不同方差相同均值,不同方差标准正态分布如果变量X的均值为,方差为,定义一个新的变量Z,则根据性质5,变量Z的均值为0
5、,方差为1。在统计学中,我们称之为单位或标准正态变量,用符号表示为:任一给定均值和方差的正态变量都可转化为标准正态变量,将其标准化可以大大简化计算。例:变量X表示面包房每日出售的面包量,假定它服从均值为70、方差为9的正态分布,即X~(70,9),求任给一天,出售面包数量大于75条的概率。首先,定义变量Z,Z=(75-70)/3≈1.67求:P(Z>1.67)查正态分布表得:P(0≦Z≦1.67)=0.4525则:P(Z>1.67)=0.5-0.4525=0.0475即每天出售面包的数量超过75条的概率为0.0475
6、。1.6700.45250.0475f(Z)标准正态变量概率密度函数§2样本均值的抽样分布或概率分布引言:样本均值是总体均值的估计量,但是由于样本均值是依靠某一给定样本而定,因此它的值会因随机样本的不同而变化。由此,我们将样本均值看作随机变量,在样本是随机抽取得到的条件下,求样本均值的概率密度函数。随机抽样:表示总体中每一个个体有同等机会被选入样本。独立同分布随机变量:由X1、X2,…,Xn构成容量为n的随机样本Xs,如果所有的Xs是从同一个概率密度(Xi有相同的概率密度函数)中独立抽取得到的,称Xs为独立同分布随机
7、变量。2.1样本均值的概率密度例:已知正态分布的均值为10,方差为4,即N(10,4)。现在从这个正态总体中抽取20个随机样本,每个样本包括20个观察值,对抽取的每一个样本,得到其样本均值,因此,共有20个样本均值。来自N(10,4)的20个样本均值9.64110.13410.04010.2499.17410.32110.4809.50411.3868.6219.7409.7399.93710.18410.2509.76510.33410.41010.5710.57求和=201.0520个样本的频率分布样本均值范围频
8、数频率8.5~9.010.059.0~9.520.109.5~10.050.2510.0~10.590.4510.5~11.020.1011.0~11.510.058.759.259.7510.2510.7511.250.500.050.25样本均值来自N(10,4)总体的20个样本均值的分布理论依据:若X1,X2,X3,…,Xn是来自于均值为
此文档下载收益归作者所有