资源描述:
《《数理统计基础》PPT课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第六章统计量及其抽样分布§1引言§2总体与样本§3统计量及其分布§1引言本书前五章的研究属于概率论的范畴.在那里,随机变量及其概率分布全面描述了随机现象的统计规律性,在概率论很多问题中,情形往往并非如此,试看下面的例子.【引例】某公司要采购一批产品,每件产品要么是正品,要么是次品,若设这批产品的次品率为p(一般是未知的),则从该批产品中随机抽取一件,用X表示抽到的次品数,不难看出X服从0-1分布B(1,p),但分布中的参数p是不知道的.显然,p的大小决定了该批产品的质量,它直接影响采购行为的经济效益,故人们对p提出一些问题,比如:“p的大小如何?”“p大概落在什么范围内?”“能否认为p满足设
2、定要求(如p≤5%)?”从上例中不难看出,在概率论中研究的随机变量,它们的概率分布往往是已知的,但这在实际问题中,我们考察的随机现象虽然可以用某个随机变量X去描述它们,但X的概率分布往往是未知的,这就需要我们用数理统计的方法来解决此类实际问题,由此可见,数理统计学在理论和应用上的重要性.§2总体与样本§2.1总体与个体在一个统计问题中,我们把研究对象的全体称为总体,构成总体的每个成员称为个体.对多数实际问题.总体中的个体是一些实在的人或物.比如,我们要研究某大学的学生身高情况,则该大学的全体学生构成问题的总体,而每一个学生即是一个个体.事实上,每个学生有许多特征:性别、年龄、身高、体重、民族
3、、籍贯等.而在该问题中,我们关心的只是该校学生的身高如何,对其他的特征暂不予以考虑.这样,每个学生(个体)所具有的数量指标值——身高就是个体,而将所有身高全体看成总体.这样一来,若抛开实际背景,总体就是一堆数,这堆数中有大有小,有的出现的机会多,有的出现的机会少,因此用一个概率分布去描述和归纳总体是恰当的.从这个意义上看,总体就是一个分布,而其数量指标就是服从这个分布的随机变量.以后说“从总体中抽样”与“从某分布中抽样”是同一个意思.【例6-1】考察某厂的产品质量,将其产品只分为合格品与不合格品,并以0记合格品,以1记不合格品,则总体={该厂生产的全部合格品与不合格品}={由0或1组成的一
4、堆数}.若以p表示这堆数中1的比例(不合格品率),则该总体可由一个二点分布表示:不同的p反映了总体间的差异.例如,两个生产同类产品的工厂的产品总体分布为:我们可以看到,第一个工厂的产品质量优于第二个工厂.实际中,分布中的不合格品率是未知的,如何对之进行估计是统计学要研究的问题.§2.2样本为了了解总体的分布,我们从总体中随机地抽取n个个体,记其指标值为x1,x2,…,xn,则x1,x2,…,xn称为总体的一个样本,n称为样本容量,或简称样本量,样本中的个体称为样品.我们首先指出,样本具有所谓的二重性:一方面,由于样本是从总体中随机抽取的,抽取前无法预知它们的数值,因此,样本是随机变量,用大写
5、字母X1,X2,…,Xn表示;另一方面,样本在抽取以后经观测就有确定的观测值,因此,样本又是一组数值.此时用小写字母x1,x2,…,xn表示是恰当的.简单起见,无论是样本还是其观测值,本书中样本一般均用x1,x2,…,xn表示,读者应能从上下文中加以区别.[例6-2]啤酒厂生产的瓶装啤酒规定净含量为640g,由于随机性,事实上不可能使得所有的啤酒净含量均为640g,现从某厂生产的啤酒中随机抽取10瓶测定其净含量,得到如下结果:641635640637642638645643639640这是一个容量为10的样本的观测值.对应的总体为该厂生产的瓶装啤酒的净含量.从总体中抽取样本时,为使样本具有代
6、表性,抽样必须是随机抽样.通常可以用随机数表来实现随机抽样.还要求抽样必须是独立的,即每次的结果互不影响.在概率论中,在有限总体(只有有限个个体的总体)中进行有放回抽样,是独立的随机抽样;然而,若为不放回抽样,则是不独立的抽样.但当总体容量N很大但样本容量n较小时,不放回抽样可以近似地看做放回抽样,即可近似看做独立随机抽样.下面,我们假定抽样方式总满足独立随机抽样的条件.从总体中抽取样本可以有不同的抽法,为了能由样本对总体做出较可靠的推断,就希望样本能很好地代表总体.这就需要对抽样方法提出一些要求,最常用的“简单随机抽样”有如下两个要求:(1)样本具有随机性,即要求总体中每一个个体都有同等机
7、会被选入样本,这便意味着每一样品xi与总体X有相同的分布.(2)样本要有独立性,即要求样本中每一样品的取值不影响其他样品的取值,这意味着x1,x2,…,xn相互独立.用简单随机抽样方法得到的样本称为简单随机样本,也简称样本.除非特别指明,本书中的样本皆为简单随机样本.于是,样本x1,x2,…,xn可以看成是相互独立的具有同一分布的随机变量,其共同分布即为总体分布.设总体X具有分布函数F(x),x1,x2,…,