欢迎来到天天文库
浏览记录
ID:52125451
大小:526.50 KB
页数:42页
时间:2020-04-01
《曾五一应用统计学第5章.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第五章抽样与抽样分布1本章主要内容:第一节抽样的基本概念第二节抽样分布第三节抽样设计第四节大数定理与中心极限定理2第一节抽样的基本概念一、总体参数与样本统计量(一)总体参数总体参数就是总体分布的数量特征。最常见的总体参数是:总体的平均数、成数、方差、标准差等。(二)样本统计量样本统计量是一个不含任何总体参数的样本函数。统计量既然是样本函数,它的取值就随样本而变化,所以统计量本身也是随机变量,存在一定的分布。常见的样本统计量有:二、样本容量与样本个数1.样本容量。样本集合的大小称为样本容量,一般用n表示。一般地,样本容量大于30的样本称为大样本,不超过30的样本称为小样本。2.样本个数。
2、样本个数又称样本可能数目,它是指从一个总体中可能抽取多少种样本。样本个数的多少与抽样方法有关。三、重复抽样与不重复抽样简单随机抽样的方法有:重复抽样;不重复抽样。第二节抽样分布一、重复抽样分布1.样本平均数的抽样分布样本平均数的抽样分布是由总体中全部样本平均数的可能取值和与之相应的概率组成。【例5-1】某班组有5个工人,他们的单位工时工资分别是4、6、8、10、12元,现用重复抽样方式从5个工人中抽出2人,列出样本平均数的分布,并计算样本平均数的数值特征。=8(元2)=8(元)结论:(1)重复抽样的样本平均数的平均数等于总体平均数,即:。(2)在重复抽样下,有上式中,是总体标准差,n为
3、样本单位数。样本平均数分布的中心与总体的分布中心完全相同,样本平均数的方差是总体分布方差的。因此,样本平均数分布的集中趋势优于总体分布自身的集中趋势。由于样本平均数能“集中”分布于总体平均数附近,我们可以考虑用样本平均数来估计总体的平均数。用样本统计量去估计总体参数难免有误差,样本统计量的离散程度越大,产生误差的可能性也越大。我们用样本统计量的标准差来反映抽样误差水平,有时直接称其为抽样误差。我们用样本平均估计总体平均时,就以样本平均数的标准差作为抽样误差,并称之抽样平均误差。二、不重复抽样分布1.样本平均数分布仍以例5-1资料为例,在不重复抽样条件下样本平均数的分布:=8(元)数学上
4、可以证明,在不重复抽样条件下:不重复抽样与重复抽样比,多了一个系数,这个系数称为不重复抽样的修正系数。由于该系数的取值在(0,1)之间,因此,不重复抽样标准差比重复抽样小。当总体单位数N很大时,修正系数近似1,通常可以用重复抽样条件下样本平均数的标准差来代替不重复抽样条件下样本平均数的标准差。三、成数抽样重复抽样不重复抽样第三节抽样设计一、类型抽样类型抽样也称分层抽样,它是在对总体有一定认识的基础上,按与调查目的有关的主要标志对总体各单位进行分类,然后分别从每一类中按随机原则抽取一定的单位构成样本。类型抽样下样本平均数的标准差:【例5-4】对某市个体商户的月零售额进行抽样调查,由于个体
5、商户之间的零售额差别较大,先按申报的资金划分为大、中、小三类,按15%的比例总共抽取90户进行调查,结果如表所示。计算样本平均零售额及其标准差。解:样本平均数是:(元)(元2)所以,类型抽样样本平均数的标准差是:(元)二、等距抽样等距抽样又称机械抽样或系统抽样,它是将总体各单位按某一标志进行排序,然后按固定的间隔来抽取样本单位的抽样组织形式。等距抽样的间隔,应避免与现象本身的节奏性或循环周期相重合。等距抽样下样本平均数的标准差,如果用来排队的标志是无关标志,而且随机起点取样,那么它就十分接近简单随机抽样的情形。为了简便起见,可以采用简单随机抽样下样本平均数的标准差公式近似。【例5-5】
6、年终在某储蓄所中按定期存款帐号顺序进行每隔5户的等距抽样,得到如下资料:计算样本平均定期存款金额及其标准差。解:样本平均存款金额(元)样本的标准差=2.02(元)样本平均的标准差()三、整群抽样整群抽样,又称为集团抽样,就是将总体各单位分成若干群,然后从其中随机抽取部分群,对选中的群进行全面调查的抽样组织方式。【例5-6】加油站从某季度中随机抽取10天,对所有进站加油车辆进行登记,得到每一天中平均加油量如下,计算样本平均数(平均每次加油量)以及样本平均数的标准差。四、抽样组织的设计1.简单随机抽样是基本抽样组织方式2.类型抽样与整群抽样比较(1)减小类型抽样中样本平均数标准差的办法。(
7、2)减小整群抽样的样本平均数标准差的办法。第四节大数定理与中心极限定理中心极限定理告诉我们无论总体服从何种分布,只要它的平均数与标准差客观存在,我们就可以通过增大样本容量n的方式,保证样本平均数近似服从正态分布。样本容量n越大,样本平均数的分布就越接近正态分布。一般认为样本单位数不少于30的是大样本,大样本的平均数近似服从正态分布。【例5-8】某公司1000名职工的人均年奖金为20000元,标准差5000元,从中随机抽取36人作为样本进行调查,
此文档下载收益归作者所有