欢迎来到天天文库
浏览记录
ID:50745723
大小:4.96 MB
页数:94页
时间:2020-03-13
《分布与抽样分布.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第三章分布与抽样分布第二节抽样分布第一节概率与概率分布第三节统计推断第一节概率与概率分布统计学CertainImpossible0.501一概率(一)概率的统计定义研究随机试验,仅知道可能发生哪些随机事件是不够的,还需了解各种随机事件发生的可能性大小,以揭示这些事件的内在的统计规律性,从而指导实践。这就要求有一个能够刻划事件发生可能性大小的数量指标,这指标应该是事件本身所固有的,且不随人的主观意志而改变,人们称之为概率(probability)。事件A的概率记为P(A)。概率的统计定义在相同条件下进行n次重复试验,如果随机事件A发生的次数为m,那么m/n称为
2、随机事件A的频率(frequency);当试验重复数n逐渐增大时,随机事件A的频率越来越稳定地接近某一数值p,那么就把p称为随机事件A的概率。这样定义的概率称为统计概率(statisticsprobability),或者称后验概率(posteriorprobability)表3-1抛掷一枚硬币发生正面朝上的试验记录从表3-1可看出,随着实验次数的增多,正面朝上这个事件发生的频率越来越稳定地接近0.5,我们就把0.5作为这个事件的概率。在一般情况下,随机事件的概率p是不可能准确得到的。通常以试验次数n充分大时随机事件A的频率作为该随机事件概率的近似值。即P(A
3、)=p≈m/n(n充分大)(二)概率的性质1、对于任何事件A,有0≤P(A)≤1;2、必然事件的概率为1,即P(Ω)=1;3、不可能事件的概率为0,即P(ф)=0。一个总体是由一个随机变量的所有可能取值来构成的,而样本只是这些所有可能取值的一部分随机变量中某一个值出现的概率,只是随机变量一个侧面的反映,若要全面了解随机变量则必须知道随机变量的全部值和各个值出现的概率,即随机变量的概率分布■概率和概率分布是生命科学研究中由样本推断总体的理论基础随机变量的种类很多,每一种随机变量都有其特定的概率分布。连续型随机变量离散型随机变量在一定范围内可连续取值的变量。在一
4、定范围内只取有限种可能的值的变量。正态分布二项分布、泊松分布二概率分布1.正态分布正态分布(normaldistribution)的概念是由德国数学家和天文学家Moivre于1733年首次提出的,由德国数学家Gauss率先将其应用于天文学研究,故正态分布又称为Gauss分布(Gaussiandistribution)。许多生物学领域(如身高、体重、脉搏、血红蛋白、血清总胆固醇等)的随机变量都服从或者近似服从正态分布或通过某种转换后服从正态分布,许多其他类型分布基本上都与正态分布有关,它们的极限就是正态分布。1.1正态分布的定义在日常工作中所遇到的变量大多是连
5、续型随机变量,当这一类随机变量呈线性时,往往服从正态分布频数分布表:下面我们以某地13岁女孩118人的身高(cm)资料,来说明身高变量服从正态分布。频数分布图(又称直方图)从频数表及频数分布图上可得知:该数值变量资料频数分布呈现中间频数多,左右两侧基本对称的分布。所以我们通俗地认为该资料服从正态分布。频数分布图二频数分布图三正态分布图四和正态分布相对应的曲线称为正态分布密度曲线,简称为正态曲线。用来描述正态曲线的函数称为正态分布密度函数μ—总体平均数σ2—总体方差π—圆周率3.14σ—总体标准差■任何一个正态分布均由参数μ和σ所决定如果一个随机变量x服从平均
6、数为μ、方差为σ2的正态分布,可记为x~N(μ,σ2)。e—自然对数的底,2.718281.2正态分布的特点(1)正态分布曲线以直线x=μ为对称轴,左右完全对称(3)正态分布曲线有两个拐点,拐点座标分别为(μ-σ,f(μ-σ))和(μ+σ,f(μ+σ)),在这两个拐点处曲线改变方向,即曲线在(-∞,μ-σ)和(μ+σ,+∞)区间上是下凹的,在[μ-σ,μ+σ]区间内是上凸的●●●(2)在x=μ处,f(x)有最大值(4)正态分布密度曲线的位置由μ决定(μ为位置参数),形状由σ决定(σ为形状参数)(5)正态分布曲线向两边无限延伸,以x轴为渐进线,分布从-∞到+∞
7、μ的大小决定了曲线在x轴上的位置σ的大小则决定了曲线的胖瘦程度当σ恒定时,μ愈大,则曲线沿x轴愈向右移动μ愈小,曲线沿x轴愈向左移动σ越大表示数据越分散,曲线越胖σ越小表示数据越集中,曲线越瘦1.3标准正态分布正态分布由μ和σ所决定,不同的μ、σ值就决定了不同的正态分布密度函数,因此在实际计算中很不方便的。需将一般的N(μ,σ2)转换为μ=0,σ2=1的正态分布。我们称μ=0,σ2=1的正态分布为标准正态分布(standardnormaldistribution)可见,由正态分布密度函数得到标准正态分布密度函数:1.4正态分布的概率计算根据概率论原理,可知随
8、机变量x在区间(a,b)内取值的概率是一块面积:面积
此文档下载收益归作者所有