资源描述:
《南农统课本示稿第4章正态分布起课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、试验设计与统计分析第四章理论分布和抽样分布本课程使用盖钧镒主编的《试验统计方法》一书作为课本。全程为38学时,占2学分。第二章试验设计与实施第三章次数分布和平均数、变异数第五章统计假设测验第八章参数估计方法第六章方差分析第七章卡方测验第九章直线回归和相关第一章科学实验及其误差控制第十章多元回归和相关第十四章不完全区组设计和统计分析第十二章单因素试验的统计分析第十三章多因素试验结果的统计分析第十五章抽样调查第十一章曲线回归第四章理论分布和抽样分布第二节二项分布第一节事件、概率和随机变量第三节正态分布第四节抽
2、样分布第五节几种常用的分布第三节正态分布既然连续性随机变量有无数个连续的可能的值,因此无法象对待离散型随机变量那样,对每个可能的值计算出其发生的概率。事实上,连续型随机变量刚好等于某一个值的概率为0。如果随机事件在某一范围内有无数个连续的可能结果,则相应的随机变量叫做连续型随机变量。对连续型随机变量只能计算调查的对象其观察值落在某一个区间范围内的概率。方法是:为某一种连续型随机变量寻找一个合适的函数,利用这函数在某一区间内的定积分来表示该变量落在该区间的概率。这样的函数称为该随机变量的分布密度函数。第三节
3、正态分布如果对于某一个随机变量x,找到一个函数f(x),它具有下列性质:⑴当x为任何实数时,f(x)≥0,即f(x)为非负函数;⑵x在区间(-,)中的广义积分,即f(x)与x轴之间的总面积为1;⑶,即x落在区间(x1,x2)之间的概率刚好等于这区间内的定积分。则称函数f(x)为该随机变量x的分布密度函数。它的原函数称为概率分布函数,简称分布函数。x1x2不同的随机变量可能具有不同的分布,因而有不同的密度函数。以下介绍几种最常用的连续型随机变量的分布。第三节正态分布于是,随机变量y落在区间(y1,y2)
4、内的概率为:若随机变量y的概率密度函数为:则称随机变量y服从具有参数和 的正态分布。记为。其中为y的平均数,为y的方差。其概率分布函数为:第三节正态分布利用密度函数可以作出正态分布曲线的图像。-2+2-3-++3f(y)y第三节正态分布-2+2-3-++3f(y)y正态曲线的特性:⑴单峰,倒钟状,当y=时,f(y)达最大值;⑵当y±时,f(y)0;⑶以y=为轴左右对称;⑷曲线与横轴间面积为1;⑸在y=处有两个拐点;⑹若不变,改变使
5、曲线左右平移,形状不变;=0时,对称轴与纵轴重合;说明代表了数据的中心位置;⑺当不变,改变使曲线形状改变,对称轴不变;当变小时,曲线变高瘦,中部的面积变大;当变大时,曲线变矮胖,中部的面积变小;说明衡量了资料的变异程度。面积占68.27%面积占95.45%y的某区间内曲线与横轴之间的面积就是随机变量y落在该区间的概率。这部分的面积是如何计算的呢?第三节正态分布所以,随机变量y落在区间(y1,y2)内的概率为:因为正态分布函数为:计算这些定积分不是件容易的事,因此要寻求更为简单易行的方法。第三
6、节正态分布,那么将有:如果将服从分布的随机变量y进行变换:于是原变量y在区间(y1,y2)之间的概率就可以用u在区间(u1,u2)之间的概率来计算。这个u称为正态离差u的密度函数记为:并称为标准正态分布密度函数。相应地记标准正态分布的概率函数为:因为y的平均数为,方差为2,所以的平均数为:方差为:统计学家已经将标准正态分布的概率计算出来,我们只要学会查表就可以计算对应于不同的u的(u)值。第三节正态分布查p.357附表2得:(–1)=0.15866,(1)=0.84134,于是算得P(30y
7、40)=0.84134–0.15866=0.68268=68.268%。例题:已知某品种玉米单株产量y服从正态分布,,其中=35g,=5g。现从此总体中随机抽取一株,问产量落在(30,40)g之间的概率是多少?解:因为303540-101换个方式提问第三节正态分布查p.357附表2得:(–1)=0.15866,(1)=0.84134,于是算得P(30y40)=0.84134–0.15866=0.68268=68.268%。例题:已知某品种玉米单株产量y服从正态分布,,其中=35g,=5g。
8、现从此总体中随机抽取一株,问产量落在(30,40)g之间的概率是多少?解:因为有95%的可能落在什么区间?p.359附表3列出了两尾概率之和为的u值。若要用99%的把握作判断,要在附表3查得当=0.01时的u值(2.58),用它代入上式,重新计算。得:P(–2.58u2.58)=P(22.1y47.9)。显然,你要说话更有把握,就要把区间扩得宽些。22.13547.999%=0.01=0.0525.23544.