欢迎来到天天文库
浏览记录
ID:40677464
大小:196.50 KB
页数:11页
时间:2019-08-06
《自考 概率论与数理统计 (6)》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第一章统计量及其抽样分布 6.1 总体与样本 6.1.1 总体与个体 在一个统计问题中,我们把研究对象的全体称为总体,构成总体的每个成员称为个体。对多数实际问题。总体中的个体是一些实在的人或物。比如,我们要研究某大学的学生身高情况,则该大学的全体学生构成问题的总体,而每一个学生即是一个个体。事实上,每个学生有许多特征:性别、年龄、身高、体重、民族、籍贯等。而在该问题中,我们关心的只是该校学生的身高如何,对其他的特征暂不予以考虑。这样,每个学生(个体)所具有的数量指标值——身高就是个体,而将所有
2、身高全体看成总体。这样一来,若抛开实际背景,总体就是一堆数,这堆数中有大有小,有的出现的机会多,有的出现的机会少,因此用一个概率分布去描述和归纳总体是恰当的。从这个意义上看,总体就是一个分布,而其数量指标就是服从这个分布的随机变量。以后说“从总体中抽样”与“从某分布中抽样”是同一个意思。 [例6-1]考察某厂的产品质量,将其产品只分为合格品与不合格品,并以0记合格品,以1记不合格品,则 总体={该厂生产的全部合格品与不合格品}={由0或1组成的一堆数}。 若以p表示这堆数中1的比例(不合格品率
3、),则该总体可由一个二点分布表示: 不同的p反映了总体间的差异。例如,两个生产同类产品的工厂的产品总体分布为: 我们可以看到,第一个工厂的产品质量优于第二个工厂。 实际中,分布中的不合格品率是未知的,如何对之进行估计是统计学要研究的问题。 6.1.2 样本 为了了解总体的分布,我们从总体中随机地抽取n个个体,记其指标值为x1,x2,…,xn,则x1,x2,…,xn称为总体的一个样本,n称为样本容量,或简称样本量,样本中的个体称为样品。 我们首先指出,样本具有所谓的二重性:一方
4、面,由于样本是从总体中随机抽取的,抽取前无法预知它们的数值,因此,样本是随机变量,用大写字母X1,X2,…,Xn表示;另一方面,样本在抽取以后经观测就有确定的观测值,因此,样本又是一组数值。此时用小写字母x1,x2,…,xn表示是恰当的。简单起见,无论是样本还是其观测值,本书中样本一般均用x1,x2,…,xn表示,读者应能从上下文中加以区别。 [例6-2]啤酒厂生产的瓶装啤酒规定净含量为640g,,由于随机性,事实上不可能使得所有的啤酒净含量均为640g,现从某厂生产的啤酒中随机抽取10瓶测定其净
5、含量,得到如下结果: 641 635 640 637 642 638 645 643 639 640 这是一个容量为10的样本的观测值。对应的总体为该厂生产的瓶装啤酒的净含量。 【答疑编号:10060101针对该题提问】 从总体中抽取样本时,为使样本具有代表性,抽样必须是随机抽样。通常可以用随机数表来实现随机抽样。还要求抽样必须是独立的,即每次的结果互不影响。在概率论中,在有限总体(只有有限个个体的总体)中进行有放回抽样,是独立的随机抽样;然而,若为不放回抽样,则是不独立的
6、抽样。但 当总体容量N很大但样本容量n较小时,不放回抽样可以近似地看做放回抽样,即可近似看做独立随机抽样。 下面,我们假定抽样方式总满足独立随机抽样的条件。 从总体中抽取样本可以有不同的抽法,为了能由样本对总体做出较可靠的推断,就希望样本能很好地代表总体。这就需要对抽样方法提出一些要求,最常用的 “简单随机抽样”有如下两个要求: (1)样本具有随机性,即要求总体中每一个个体都有同等机会被选入样本,这便意味着每一样品xi与总体X有相同的分布。 (2)样本要有独立性,即要求样本中每一样品的取
7、值不影响其他样品的取值,这意味着x1,x2,…,xn相互独立。 用简单随机抽样方法得到的样本称为简单随机样本,也简称样本。除非特别指明,本书中的样本皆为简单随机样本。 于是,样本x1,x2,…,xn可以看成是相互独立的具有同一分布的随机变量,其共同分布即为总体分布。 设总体X具有分布函数F(x),x1,x2,…,xn为取自该总体的容量为n的样本,则样本联合分布函数为: 若总体具有密度函数f(x),则样本的联合密度函数为 若总体X为离散型随机变量,则样本的(联合)概率函数为 显
8、然,通常说的样本分布是指多维随机变量(x1,x2,…,xn)的联合分布。 [例6-3]为估计一物件的重量μ,用一架天平重复测量n次,得样本x1,x2,…,xn,由于是独立重复测量,x1,x2,…,xn是简单随机样本。总体的分布即x1的分布(x1,x2,…,xn分布相同)。由于称量误差是均值(期望)为零的正态变量,所以x1可认为服从正态分布N(μ,σ2)(X1等于物件重量μ)加上称量误差,即x1的概率密度为 这样,样本分布密度为 。 【答疑编号:100601
此文档下载收益归作者所有