欢迎来到天天文库
浏览记录
ID:38683586
大小:322.01 KB
页数:27页
时间:2019-06-17
《《分层随机抽样》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第三章分层随机抽样概述简单估计及其性质各层样本量的分配样本总量的确定分层随机抽样效果分析第一节概述分层随机抽样1.定义:抽样前,先将总体划分为L个互不重叠的层,然后再在各层进行SRS。2.层的划分:无关标志划分;相关标志划分。3.精度:取决于各层方差和样本量分配;若层划分与样本量分配合理,则精度很高。4.地位:使用广泛。因其便于组织与管理,且抽样效率一般高于SRS。第一节概述一、特点分层抽样不仅可估计总体参数,还可估计层的参数实施方便,便于组织分层样本比简单随机样本在总体中分布更均匀分层抽样能较大地提高调查地精度二、符号总体分为L层,h表示层的编号第h层单位总数:Nh样本单位数:nh层权
2、:抽样比:第h层子总体第i个单位标志值:Yhi第h层样本中第i个单位标志值:yhi总体均值:样本均值:总体方差:样本方差:第二节简单估计量及其性质一、对总体均值或总量的估计样本方差s2例:某市进行家庭收入调查,分城镇居民及农村居民两部分抽样,在全部城镇23560户中抽取300户,在全部农村148420户中抽取250户(均按简单随机抽样进行),调查结果城镇年平均户收入为15180元,标准差为2972元;农村年平均户收入为9856元,标准差为2546元。求全市年平均户收入的估计及其90%的置信区间。例:调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户划分为4层
3、,每层按简单随机抽样抽取10户,调查获得如下数据(单位:元),估计该地区居民奶制品年消费总支出及估计的标准差。层居民户总数样本户奶制品年消费支出1234567891012342004007501500105018050401302603506011015110800015100140201055603040160200258085180109016030030017022025二、对总体比例的估计例:为调查某个高血压高发病区青少年与成年人高血压的患病率,对14岁以上的人分四个年龄组进行分层随机抽样,调查结果如下,求总体高血压患病率P的估计及其标准差的估计。年龄组层权Wh层样本量nhphq
4、h14-2526-4041-6061以上0.2810.3220.2130.1844006506003500.0830.1740.3100.4640.9170.8260.6900.536第三节各层样本量的分配一、等数分配(常数分配)每层抽取相同单位数组成样本hWhn1230.20.30.5100100100二、标准差比例分配法各层所分配的抽样单位数,与该层中总体各单位标志值的离散程度成正比hWhShnh1230.20.30.520303471107122三、比例分配法概念:根据各层容量的大小不同,分配以相应不同的样本单位数,使得各层中的抽样数目与该层的总体单位数的比例相等。hWhShnh1
5、230.20.30.52030346090150总体均值与总量的估计总体均值的估计量为样本总量的常数倍(自加权)估计量的方差四、最优分配在分层随机抽样中,对于给定的费用C,能使估计量的方差V达到最小或给定数值,使总费用最小的各层样本量的分配为最优分配。柯西不等式:奈曼分配:例:n=550,城镇居民与农村居民年收入的标准差估计分别为s1=3000元,s2=2500元,对城镇居民与农村居民抽样平均每户的费用比为1:2,试求城镇与农村两层比例分配与最优分配的样本量。又若不考虑费用因素,那么最优分配的结果又有何变化?(P84)第四节样本总量的确定一、估计总体均值时n的确定比例分配:奈曼分配:最优
6、分配:例:某市进行家庭收入调查,分城镇居民及农村居民两部分抽样,在全部城镇23560户中抽取300户,在全部农村148420户中抽取250户(均按简单随机抽样进行),调查结果是城镇年平均户收入的标准差为3000元,农村的为2500元,对城镇居民与农村居民抽样平均每户的费用比为1:2,若要求总体均值的95%的绝对误差限d=200,求比例分配、奈曼最优分配及一般最优分配下所需要的总样本量,及计算各种分配形式下的总费用(设c0=0,P90)二、给定总费用时样本量的确定
此文档下载收益归作者所有