欢迎来到天天文库
浏览记录
ID:52704289
大小:1.95 MB
页数:29页
时间:2020-03-29
《抽样调查学案分层随机抽样法.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第3章分层随机抽样在前面一章,我们介绍了简单随机抽样。应该说简单随机抽样在实际中具有广泛的应用,尤其是在总体N较小或者总体方差与任意局部方差基本相当的情况下,简单随机抽样的优势明显。然而,当总体单元数N较大或者总体各单元之间差异较大时,采用简单随机抽样对总体指标进行估计通常会产生很大的误差。例如,欲通过调查了解我国居民的人均年收入水平。这时总体是全国人口的13亿人,倘若采取简单随机抽样从中抽取10万人入样,则需要将全国人口依次编号,然后在1~13亿中生产10万个随机数,然后将这些随机数一一对应成具体某个人。显然这样做是不实际的,就算可以,由
2、于某些人口较少的省市或民族的样本量过小,甚至没有样本点,从而降低了样本对总体的代表性。不仅如此,由于类似的全国性调查总是需要地方政府的大力协调与配合,如果地方政府不能通过此次调查获取辖区内的相关信息,达到一举两得的效果,那就勉为其难了。为了克服简单随机抽样上述缺陷和不足,本章引入——分层随机抽样3、L个子总体所包含的单元数分别为,即有:b5E2RGbCAP,,定义3.2分层抽样又称为类型抽样或分类抽样,即抽样在每个层中独立进行,总的样本由各层样本构成。定义3.3分层随机抽样若在每层中的抽样采用SRS,这样得到的样本为分层随机样本4、3d<2)可以同时对子总体进行参数估计;<3)便于依托各级管理机构进行组织和实施。<层内类似,层间差异)<三)符号说明用下标表示层号<)。关于第层子总体的记号如下单元总数:,样本单元数:,第个单元标志值<观察值):,层权:,抽样比子总体均值:,子样本均值:,子总体总量:,子样本总量:<注意此说法)子总体方差:,子样本方差:§3.2简单估计量及其性质一、总体均值的估计<一)简单估计量的定义对于分层样本,对总体的均值估计是通过对各层的子总体均值估计,按层权加权平均得到的。因此总体均值估计量的公式为:<局部平均加权)<3.1)根据简单随机抽样:,5、,分别是,,76/29的估计量,而且它们都是无偏的。则此时公式为:<3.2)<二)估计量的性质定理3.1对于一般的分层抽样,如果是的无偏估计<),则是的无偏估计。定理3.2的方差<均方误差)为:<3.3/3.4)证明:由于各层抽样是独立的,故上面两结论自然成立。#定理3.3对于分层随机抽样,是的无偏估计,的方差为:<3.6/3.7)<3.8/3.9)证明:显然#定理3.4对于分层随机抽样,的一个无偏估计为:<3.10)<3.11/3.12)证明:显然#二、总体总量的估计<一)简单估计量的定义,<二)估计量的性质推论3.1<1)对于一般的分层6、抽样,如果是的无偏估计<),则是的无偏估计。的方差<均方误差)为:76/29证明:显然#<2)对于分层随机抽样,是的无偏估计,的方差为:证明:显然#<3)对于分层随机抽样,的一个无偏估计为:证明:显然#例3.1调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民划分为4层,每层按简单随机抽样抽取10户,调查获得数据如下<单位:元),如表3.1。估计该地区居民奶制品年消费总支出及估计的标准差。RTCrpUDGiT表3.1解:由上表,,,各层层权和抽样比为:76/29,,,,,,,。各层的样本均值及样本方差为:,,,,7、,,,,因此估计奶制品年消费总支出为:=209650<元)估计量方差和标准差样本估计值为:<元)95%的置信区间为,即[164162,255138].三、总体比例的估计<一)简单估计量的定义易知总体比例的估计为:<二)估计量的性质推论3.2<1)对一般分层抽样,如果是的无偏估计<)则是P的无偏估计,的方差为:。76/29<2)对于分层随机抽样,是P的无偏估计,注意到及,因此的方差为:(3.15>(3.17><3)对于分层随机抽样,的一个无偏估计为:(3.16>例3.2在例3.1的调查中,同时调查了居民户拥有家庭电脑的情况,获得如下数据<单位8、:台)如表3.2。估计该地区居民用有家庭电脑的比例及估计的标准差。5PCzVD7HxA表3.2解:由上表可得,,,,76/29,,,因此,该地区居民拥有家庭电脑比例为:,推论3.
3、L个子总体所包含的单元数分别为,即有:b5E2RGbCAP,,定义3.2分层抽样又称为类型抽样或分类抽样,即抽样在每个层中独立进行,总的样本由各层样本构成。定义3.3分层随机抽样若在每层中的抽样采用SRS,这样得到的样本为分层随机样本4、3d<2)可以同时对子总体进行参数估计;<3)便于依托各级管理机构进行组织和实施。<层内类似,层间差异)<三)符号说明用下标表示层号<)。关于第层子总体的记号如下单元总数:,样本单元数:,第个单元标志值<观察值):,层权:,抽样比子总体均值:,子样本均值:,子总体总量:,子样本总量:<注意此说法)子总体方差:,子样本方差:§3.2简单估计量及其性质一、总体均值的估计<一)简单估计量的定义对于分层样本,对总体的均值估计是通过对各层的子总体均值估计,按层权加权平均得到的。因此总体均值估计量的公式为:<局部平均加权)<3.1)根据简单随机抽样:,5、,分别是,,76/29的估计量,而且它们都是无偏的。则此时公式为:<3.2)<二)估计量的性质定理3.1对于一般的分层抽样,如果是的无偏估计<),则是的无偏估计。定理3.2的方差<均方误差)为:<3.3/3.4)证明:由于各层抽样是独立的,故上面两结论自然成立。#定理3.3对于分层随机抽样,是的无偏估计,的方差为:<3.6/3.7)<3.8/3.9)证明:显然#定理3.4对于分层随机抽样,的一个无偏估计为:<3.10)<3.11/3.12)证明:显然#二、总体总量的估计<一)简单估计量的定义,<二)估计量的性质推论3.1<1)对于一般的分层6、抽样,如果是的无偏估计<),则是的无偏估计。的方差<均方误差)为:76/29证明:显然#<2)对于分层随机抽样,是的无偏估计,的方差为:证明:显然#<3)对于分层随机抽样,的一个无偏估计为:证明:显然#例3.1调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民划分为4层,每层按简单随机抽样抽取10户,调查获得数据如下<单位:元),如表3.1。估计该地区居民奶制品年消费总支出及估计的标准差。RTCrpUDGiT表3.1解:由上表,,,各层层权和抽样比为:76/29,,,,,,,。各层的样本均值及样本方差为:,,,,7、,,,,因此估计奶制品年消费总支出为:=209650<元)估计量方差和标准差样本估计值为:<元)95%的置信区间为,即[164162,255138].三、总体比例的估计<一)简单估计量的定义易知总体比例的估计为:<二)估计量的性质推论3.2<1)对一般分层抽样,如果是的无偏估计<)则是P的无偏估计,的方差为:。76/29<2)对于分层随机抽样,是P的无偏估计,注意到及,因此的方差为:(3.15>(3.17><3)对于分层随机抽样,的一个无偏估计为:(3.16>例3.2在例3.1的调查中,同时调查了居民户拥有家庭电脑的情况,获得如下数据<单位8、:台)如表3.2。估计该地区居民用有家庭电脑的比例及估计的标准差。5PCzVD7HxA表3.2解:由上表可得,,,,76/29,,,因此,该地区居民拥有家庭电脑比例为:,推论3.
4、3d<2)可以同时对子总体进行参数估计;<3)便于依托各级管理机构进行组织和实施。<层内类似,层间差异)<三)符号说明用下标表示层号<)。关于第层子总体的记号如下单元总数:,样本单元数:,第个单元标志值<观察值):,层权:,抽样比子总体均值:,子样本均值:,子总体总量:,子样本总量:<注意此说法)子总体方差:,子样本方差:§3.2简单估计量及其性质一、总体均值的估计<一)简单估计量的定义对于分层样本,对总体的均值估计是通过对各层的子总体均值估计,按层权加权平均得到的。因此总体均值估计量的公式为:<局部平均加权)<3.1)根据简单随机抽样:,
5、,分别是,,76/29的估计量,而且它们都是无偏的。则此时公式为:<3.2)<二)估计量的性质定理3.1对于一般的分层抽样,如果是的无偏估计<),则是的无偏估计。定理3.2的方差<均方误差)为:<3.3/3.4)证明:由于各层抽样是独立的,故上面两结论自然成立。#定理3.3对于分层随机抽样,是的无偏估计,的方差为:<3.6/3.7)<3.8/3.9)证明:显然#定理3.4对于分层随机抽样,的一个无偏估计为:<3.10)<3.11/3.12)证明:显然#二、总体总量的估计<一)简单估计量的定义,<二)估计量的性质推论3.1<1)对于一般的分层
6、抽样,如果是的无偏估计<),则是的无偏估计。的方差<均方误差)为:76/29证明:显然#<2)对于分层随机抽样,是的无偏估计,的方差为:证明:显然#<3)对于分层随机抽样,的一个无偏估计为:证明:显然#例3.1调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民划分为4层,每层按简单随机抽样抽取10户,调查获得数据如下<单位:元),如表3.1。估计该地区居民奶制品年消费总支出及估计的标准差。RTCrpUDGiT表3.1解:由上表,,,各层层权和抽样比为:76/29,,,,,,,。各层的样本均值及样本方差为:,,,,
7、,,,,因此估计奶制品年消费总支出为:=209650<元)估计量方差和标准差样本估计值为:<元)95%的置信区间为,即[164162,255138].三、总体比例的估计<一)简单估计量的定义易知总体比例的估计为:<二)估计量的性质推论3.2<1)对一般分层抽样,如果是的无偏估计<)则是P的无偏估计,的方差为:。76/29<2)对于分层随机抽样,是P的无偏估计,注意到及,因此的方差为:(3.15>(3.17><3)对于分层随机抽样,的一个无偏估计为:(3.16>例3.2在例3.1的调查中,同时调查了居民户拥有家庭电脑的情况,获得如下数据<单位
8、:台)如表3.2。估计该地区居民用有家庭电脑的比例及估计的标准差。5PCzVD7HxA表3.2解:由上表可得,,,,76/29,,,因此,该地区居民拥有家庭电脑比例为:,推论3.
此文档下载收益归作者所有