整群抽样ppt课件.ppt

整群抽样ppt课件.ppt

ID:50685433

大小:911.50 KB

页数:29页

时间:2020-03-15

整群抽样ppt课件.ppt_第1页
整群抽样ppt课件.ppt_第2页
整群抽样ppt课件.ppt_第3页
整群抽样ppt课件.ppt_第4页
整群抽样ppt课件.ppt_第5页
资源描述:

《整群抽样ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、设想国家教育部想了解上海中学生的体质状况,抽样调查是既省钱又省时的办法,显然上海地区的中学生均是总体的单元,从全体学生中随机无放回地抽取若干样本是理想的概率抽样方法,但是编制全体中学生的抽样框本身是件麻烦事,况且一个合理的有代表性的样本一般应该遍布全市,在对如此分散的中学生样本逐个进行访问,其工作量之大可想而知。一个方便的方法是在上海地区按学校抽样,在抽得的几所学校中对该校所有中学生进行普遍调查。这就是本章要讲述的整群抽样。第八章整群抽样若总体可分为N个初级单元(称为群),每个初级单元包含若干次级单元。按照某种方式从总体中抽取n个初级单元,对

2、这些单元中的所有次级单元全部进行调查。这种抽样方法称为整群抽样。1在实际工作中,整群抽样方法被广泛采用。例如,在社会经济调查中的人口调查、家计调查、农林牧业调查以及工业产品质量检验等等都经常采用整群抽样调查。采用整群抽样调查的原因有二。其一是在某些情况下,往往由于不适合采用一个个地抽取样本单位,不得不采用整群抽样。例如,某些工业产品的质量检验,事实上不能逐个抽取样本单位来进行,只能在某一时间内,成批地抽取产品来检验。其二,即使抽样调查能够一个个地取样,但由于经济的考虑也会选择整群抽样。例如,职工家庭生活水平调查中,如果不是以居委会为群进行整群

3、抽样调查,而是以居民户为单位抽样,这些被抽到的居民户一般分散地居住,必然增加交通费、延长调查时间等。所以出于对工作时间、经费等客观条件的考虑,也得采用整群抽样调查。2整群抽样作为一种抽样组织形式,具有以下的优点:1、调查单位比较集中,进行调查比较方便,可以减少调查人员来往于调查单位之间的时间和费用。例如,在进行农村居民户收入情况调查时,在一个县抽千分之五的村庄,对其所有居民户进行调查,明显地比从全县直接抽千分之五的农户进行调查,更便于组织,节省人力、旅途往返时间及费用。2、设计和组织抽样比较方便。例如,调查农村居民住户,不必列出农村所有居民住

4、户的抽样框,可以利用现成的行政区域,如县、乡、村,将农村划分为若干群,这给抽样设计方案带来很大方便。尤其是对那些无法事先掌握总体单位情况的总体,采用整群抽样更为合适。然而,整群抽样由于调查单位只能集中在若干群上,而不能均匀分布在总体的各个部分,因此,它的精度比起简单随机抽样来要低一些。3当然我们可以通过多抽几个群来弥补这一缺陷,但最关键的一条还是在于总体内群的划分。为了使整群抽样的样本具有一定的代表性,应当使群与群之间尽可能地差异小,而群内单元之间的差异应当大(注意:这一点与分层抽样中总体内层的划分有着极大的差别),这意味着每个群均具有足够的

5、代表性。如果划分的群相互之间颇多相似之处,那么少量群的抽取足以提供良好的精度。一个总体划分成多少个群,每个群的规模大小如何又是一个新问题,通常我们面临的总体会有自然的初级单元,例如本章开头所说的各所中学它们互相之间关于学生的体质很相似,但在一个学校里每个学生之间有一定的差异。例如,在一个有500个村庄、100000个农户的县,抽取1%的农户就是1000户,而抽1%的村庄则只有5个村庄,也许抽到的5个村庄农户多于1000,但由于样本单位只集中在5个村庄,显然不如在全县范围内简单随机抽取1000户分布均匀,代表性一般要差一些,抽样误差较大。4倘若

6、需要我们自行划分群,一般还要考虑到组织管理上的方便、精度上的要求以及费用的多少等等因素。§1群大小相等的整群抽样首先讨论群大小相等时的简单情况。所谓群的大小相等主要指群内次级单元的个数相等,假定关于群的抽取是随机无放回的。首先引进一些必要的记号:——表示第群中第个次级单元——表示样本中第群中第个次级单元的观测值5—第群总和—第群平均值—总体平均值—总体差异平方和—群间差异平方和—群内差异平方和将改为,则为相应的样本指标值6它们之间的关系为:(8.1)将改为,代替,由于是整群抽样,仍为,不难得到样本方差平方和的关系式:(8.2)可作为的估计,但

7、不是无偏估计。这是因为次级单元是在抽到的群内普查,此时样本不是简单随机的。由于群的选取是简单随机的,因此与分别是与的无偏估计,于是得到的无偏估计为:(8.3)7(8.4)当相当大时,该估计可近似写为:从(8.2)式可知,若n也足够大的话,也可写成(8.4)形式,此时,就可以看作是的近似无偏估计了。再引进一个群内相关的记号,这个概念的重要性在于它可以度量群内次级单元的差异程度,因为我们已经知道群内单元的差异大就可能保证样本的代表性,如何划分群实质上是一个抽样方案的设计问题。易见设计的效应好还是差在相当程度上与这个有关。的定义为:(8.5)8具体

8、计算得(8.6)计算可得,在一定程度上反映了群内单元的差异,当然这种差异一般是相对于群间差异而言的。它可以用群内方差与群间方差来表示:(8.7)当N足够大时,近似有

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。