分层随机抽样 课件.ppt

分层随机抽样 课件.ppt

ID:57013172

大小:1.25 MB

页数:79页

时间:2020-07-26

分层随机抽样 课件.ppt_第1页
分层随机抽样 课件.ppt_第2页
分层随机抽样 课件.ppt_第3页
分层随机抽样 课件.ppt_第4页
分层随机抽样 课件.ppt_第5页
资源描述:

《分层随机抽样 课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第3章分层随机抽样3.1概述2021/7/272一、定义在抽样之前,先将总体N个单元划分成L个互不重复的子总体,每个子总体称为层,它们的大小分别为,这个层合起来就是整个总体,然后,在每个层中分别独立地进行抽样,这种抽样就是分层抽样,所得到的样本称为分层样本。不重不漏总体中的每一个单元一定属于并且只属于某一个层,而不可能同时属于两个层或不属于任何一个层。定义3.1层:如果一个包含N个单元的总体可以分成“不重不漏”的L个子总体,即每个单元必属于且仅属于一个子总体,则称这样的子总体为层。即L个子总体所包含的单位数分别为,则有定义3.2分

2、层抽样:又称为类型抽样或分类抽样,即在每一层中独立进行抽样,总的样本由各层样本组成,总体参数则根据各层样本参数的汇总做出估计,这种抽样就称为分层抽样,所得样本称为分层样本。设总得样本量为n,从L个子总体中所抽取的样本量分别为,则有,定义3.3分层随机抽样:如果每层中的抽样都是独立地按照简单随机抽样进行的,那么这样的分层抽样称为分层随机抽样,所得的样本称为分层随机样本。分层随机抽样的三个必要条件(1)每层都抽;样本在总体中分布更均匀,更具代表性。(2)各层都独立地抽;每层的抽样都是独立进行,允许各层选择不同的抽样方法。分层抽样不仅能

3、对总体指标进行估计,而且能对各层指标进行估计。(3)各层的抽样都是简单随机抽样。分层抽样的抽样效率较高,也就是说分层抽样的估计精度较高。(这是因为分层抽样估计量的方差只和层内方差有关,和层间方差无关。)2021/7/276符号说明(关于第h层的记号)层号单元总数样本单元数第i个单元的值层权抽样比总体均值样本均值总体方差样本方差2021/7/2773.2简单估计量及其性质3.2.1总体均值的简单估计及其性质分层样本,总体均值的估计分层随机样本,总体均值的简单估计定理3.1:对于分层随机抽样,是的无偏估计。定理3.2:对于分层随机抽样

4、,有定理3.3:对于分层随机抽样,的估计量具有如下性质:第h层样本的样本方差。定理3.4:对于分层随机抽样,的方差的无偏估计量:推论3.1:对于分层随机抽样,总体总量的简单估计量有如下性质:(1)(2)(3)是的一个无偏估计。推论3.2:对于分层随机抽样,总体比例的简单估计量有如下性质:(1)(2)(3)是的一个无偏估计。推论3.3:对于分层随机抽样,总体中具有指定特征的单元总数的简单估计量为:具有如下性质:(1)(2)(3)是的一个无偏估计。2021/7/2714例3.1调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据

5、经济及收入水平将居民户划分为4层,每层按简单随机抽样抽取10户,调查获得如下数据(单位:元),要估计该地区居民奶制品年消费总支出及其置信区间。层居民户总数样本户奶制品年消费支出12345678910120010400110151040809002400501306080100551608516017037501802601100140602001803002204150050351502030251030252021/7/27162021/7/2717例3.2:调查了居民户拥有家庭电脑的情况,获得如下数据(单位:台),要估计该地区

6、居民拥有家庭电脑的比例及置信水平为95%的置信区间。层居民户总数样本户拥有家庭电脑情况123456789101200000100010024000100000010375011000010104150010000000002021/7/2718解:由上表可得,根据前面对各层层权及抽样比的计算结果,可得各层估计量的方差:因此,该地区居民拥有家庭电脑比例的估计为:估计量的方差为:估计量的置信区间为:两种途径:分别比估计:对每层样本分别考虑比估计量,然后对各层的比估计量进行加权平均,即先“比”后“加权”;联合比估计:对比率的分子和分母分

7、别加权计算出总体均值或总体总量的分层估计量,然后用对应的分层估计量来构造比估计,即先“加权”后“比”。3.3比率估计量及其性质分别比估计量要求每一层的样本量都比较大,如果达不到这个要求,则它的偏差可能比较大,这时要使用联合比估计量。3.3.1分别比估计定义3.4总体均值和总体总量的分别比估计为:定理3.5对于分层随机抽样的分别比估计,若各层的样本量都比较大,则有根据定理3.5,很容易推得在各层样本量都比较大的情况下,有3.3.2联合比估计定义3.5总体均值和总体总量的联合比估计为:定理3.6对于分层随机抽样的联合比估计,若各层的样

8、本量都比较大,则有根据定理3.6,很容易推得在各层样本量都比较大的情况下,有3.3.3分别比估计与联合比估计的比较两种途径:分别回归估计:对每层样本分别求取回归估计量,然后对各层的回归估计量进行加权平均,即先“回归”后“加权”;联合回归估计:对两个

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。