第4章分层随机抽样ppt课件.ppt

第4章分层随机抽样ppt课件.ppt

ID:59207313

大小:794.50 KB

页数:66页

时间:2020-09-26

第4章分层随机抽样ppt课件.ppt_第1页
第4章分层随机抽样ppt课件.ppt_第2页
第4章分层随机抽样ppt课件.ppt_第3页
第4章分层随机抽样ppt课件.ppt_第4页
第4章分层随机抽样ppt课件.ppt_第5页
资源描述:

《第4章分层随机抽样ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第四章分层随机抽样14.1概述一、分层抽样(stratifiedsampling)、分层随机抽样(stratifiedrandomsampling)分层抽样:将容量为N的总体分成L个不相重叠的子总体,子总体的大小分别为N1,N2,∙∙∙,NL,皆已知,且则每个子总体就称为层。从每层中独立地进行抽样,这样的抽样方法称为分层抽样。分层随机抽样:在分层抽样中,如果每层中的抽样都是简单随机抽样,则这样的分层抽样称为分层随机抽样。2二、分层抽样的适用场合不仅需要估计总体参数,也需要估计各层参数。便于管理,按现成的地理分布或行政划分来分层。希望样本中能包含各个部分,以增

2、加代表性。把一个内部差异很大的总体分成几个内部比较相似的子总体(层)进行分层抽样,可以提高估计量的精度。如果有极端值,也可以把它们分离出来形成一层。即“层间方差大,层内方差小”。三、进行分层抽样时,应注意的方面层内抽样设计的选择。分层变量的选择。各层样本量的分配,样本总量的确定。层数。层的分界。34.2简单估计量及其性质对总体均值或总值的估计:45例4.1总体由1000人组成,按以往的收入情况将总体分成两层:第一层(高收入层),20人;第二层(低收入层),980人。从第一层随机抽取2人,调查上月收入,得数据(单位:元)1200及1600;从第二层随机抽取8人

3、,调查上月收入,得数据(单位:元)220、230、180、320、400、340、280、360。估计这1000人上月平均收入。解:对比:6一、分层抽样中,789例4.2调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户分为4层,每层按简单随机抽样抽取10户,调查数据如下,估计该地区居民奶制品年消费总支出及估计的标准差。样本户奶制品年消费支出层居民户总数样本户奶制品年消费支出123456789101200104001101510408090024005013060801005516085160170375018026011001

4、406020018030022041500503515020302510302510解:11(3)该地区居民奶制品年消费总支出的置信度为95%的置信区间为12例4.3某市进行家庭收入调查,分城镇居民及农村居民两部分抽样,在全部城镇居民23560户中随机抽取300户,在全部农村居民148420户中随机抽取250户,调查结果是城镇年平均户收入为15180元,标准差为2972元;农村年平均户收入为9856元,标准差为2546元。求全市年平均户收入的置信度为90%的置信区间。解:133、分层随机抽样中,总体比例P的简单估计14估计的性质(1)(2)15(3)(4)1

5、64、单元总数的估计17例4.4在某行业技术人员中,按年龄分层,调查会使用计算机者所占的比例。数据如下:试估计总体中会计算机者占的比例。层人数入样人数样本中会使用计算机的人数30岁以下7781712430-35岁7497681236-40岁9779892241-45岁4627421145岁以上5366504总计3505032018解:193.3各层样本量的分配在分层随机抽样中,假设样本量n固定,201.比例分配(proportionalallocation):指按各层层权(各层单元数占总体单元数的比例)进行分配.21例4.5假设某公司欲估计某类产品的用户的每

6、年平均支出。企划人员拟就整个潜在用户的名单,共8000户。采用分层随机抽样抽取样本200户,求按比例分配时各层样本量。层每层中的潜在用户少用2000中等4000多用2000总和N=800022解:23例4.6某电视台要在某地区的住户中,调查该台的晚间新闻的收视率。该地区包括3个县,共有67401家住户。假定该电视台采用等比例分层随机抽样分别从三个县抽取住户,样本量为1500。每个县的总户数以及抽样数据列表如下:求该地区新闻收视率的95%的置信区间。县i每个县的户数Ni每个县被抽出的户数ni每个县的样本收视率pi123481071241968751071276

7、1530.270.180.17合计N=67401n=150024解:分层随机抽样时,收视率P的估计为:25收视率P的置信度为95%的近似置信区间为:即有95%的把握可以认为,该地区的新闻收视率在22.1%~26.5%之间。262.最优分配:2728293031例.在例4.2中,样本量仍为n=40,则按比例分配和Neyman分配时,各层的样本量为多少?32例4.7调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户分为4层,每层按简单随机抽样抽取10户,调查数据如下,估计该地区居民奶制品年消费总支出及估计的标准差。表:样本户奶制品年

8、消费支出层居民户总数样本户奶制品年消费支出12345

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。