资源描述:
《第4章样本及抽样分布ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第四章样本及抽样分布1第一节:随机样本第二节:抽样分布2数理统计是具有广泛应用的一个数学分支,它以概率论为理论基础,根据试验或观察得到的数据,来研究随机现象,对研究对象的客观规律性作出合理的估计和判断。概率论所研究的随机变量,其分布都是假设已知的,在这个前提下研究其性质、特点和规律性。数理统计所研究的随机变量,其分布是未知或不完全知道的。需要通过独立重复的观察并对观察数据进行分析,来推断其分布。概率论与数理统计的区别:3数理统计是具有广泛应用的一个数学分支,它以概率论为理论基础,根据试验或观察得到的数据,来研究随机现象,对研究对象的客观规律性作出合理的估计
2、和判断。概率论所研究的随机变量,其分布都是假设已知的,在这个前提下研究其性质、特点和规律性。数理统计所研究的随机变量,其分布是未知或不完全知道的。需要通过独立重复的观察并对观察数据进行分析,来推断其分布。概率论与数理统计的区别:4在数理统计中,不是对所研究的对象全体(称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断.数理统计方法具有“部分推断整体”的特征.数理统计的任务就是研究有效地收集、整理、分析所获得的有限的资料,对所研究的问题,尽可能地作出精确可靠的结论.5对随机试验的某一数量指标进行试验或观察
3、:1.总体试验的全部可能的观察值称为总体总体中所包含的个体的个数称为总体的容量每一个可能观察值称为个体总体有限总体:一大学男生的身高无限总体:一湖泊任一地点的深度,全国某种型号灯泡的寿命(容量很大的有限总体)6总体中的每一个个体是随机试验的一个观察值,因此它是某一随机变量X的值一个总体对应一个随机变量X不再区分总体和相应的随机变量,统称为总体XX的分布函数和数字特征称为总体的分布函数和数字特征例如:研究某批灯泡的寿命时,关心的数量指标就是寿命。那么,此总体就可以用随机变量X表示。7总体分布一般是未知,或只知道是包含未知参数的分布。为推断总体分布及各种特征,
4、按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为“抽样”。所抽取的部分个体称为样本。样本中所包含的个体数目称为样本容量。2.样本8一旦取定一组样本X1,…,Xn,得到n个具体的数(x1,x2,…,xn),称为样本的一次观察值,简称样本值.n称为这个样本的容量.9最常用的一种抽样叫作“简单随机抽样”,其特点:1.随机性为使样本具有充分的代表性,抽样必须是随机的,应使总体中的每一个个体都有同等的机会被抽取到.2.独立性各次抽样必须是相互独立的,即每次抽样的结果既不影响其它各次抽样的结果,也不受其它各次抽样结果的影响.10定义:
5、由简单随机抽样得到的样本称为简单随机样本,它可以用与总体独立同分布的n个相互独立的随机变量X1,X2,…,Xn表示.11简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,…,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.=F(x1)F(x2)…F(xn)若总体的分布函数为F(x)、概率密度函数为f(x),则其简单随机样本的联合分布函数为其简单随机样本的联合概率密度函数为=f(x1)f(x2)…f(xn)12例如:考察某大学一年级2000名男生的身高总体:2000名男生身高的所有可能值。等价于某个随机变量X。样本:例如抽取10名男生,
6、则这10名男生的身高可能值为一个样本。可表示为随机变量X1,…,X10。样本值:这10名男生的身高测量值,记为x1,…,x10。注意:事实上我们抽样后得到的资料都是具体的、确定的值。我们只能观察到随机变量取的值而见不到随机变量。3.总体、样本、样本值的关系13总体(理论分布)?样本样本值统计是从手中已有的资料--样本值,去推断总体的情况---总体分布F(x)的性质.总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.样本是联系二者的桥梁14例如设某批产品共有N个,其中的次品数为M,其次品率为若p是未知的,则可用抽样方法
7、来估计它.X服从参数为p的0-1分布,可用如下表示方法:从这批产品中任取一个产品,用随机变量X来描述它是否是次品:15设有放回地抽取一个容量为n的样本的联合分布为其样本值为样本空间为16若抽样是无放回的,则前次抽取的结果会影响后面抽取的结果.例如所以,当样本容量n与总体中个体数目N相比很小时,可将无放回抽样近似地看作放回抽样.17定义请注意:§2抽样分布统计量18例是未知参数,若,已知,则为统计量是一样本,是统计量,其中则但不是统计量.19常用的统计量为样本均值为样本方差为样本标准差设是来自总体X的容量为n的样本,称统计量20为样本的k阶原点矩为样本的
8、k阶中心矩例如21统计量的观察值仍分别称为样本均值、样本方差、样本