资源描述:
《抽样调查-第5章不等概抽样.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、§5.1不等概抽样一、概念与特点前面所学的简单随机抽样,总体中的每个单元具有同样的入样概率,它是等概率抽样。与等概率抽样对应的另一类方法是不等概抽样,也就是在抽样前赋予总体每个单元一个入样概率.一般而言,每个单元的入样概率是由该单元在整体中的地位来确定的.因此每个单元的入样概率可能是不相同的.什么时候使用不等概抽样?实际工作中,如果遇到下面几种情况,则可以考虑使用不等概抽样:1、抽样单元在总体中所占的地位不一致2、调查的总体单元与抽样总体的单元不一致3、改善估计量不等概抽样的优点:提高估计精度,减少抽样误差。二、不等概抽样的种类1、放回不等概抽样首先给整
2、体的每一个单元赋予一个确定的入样概率(通常是不相等的),然后在总体中对每个单元按入样概率进行抽样,抽取出来的样本单元记录后又放回总体,再进行下一次的抽样,很显然每次抽样都是独立的。放回不等概抽样中,最常用的是按照整体单元的规模大小来确定单元在每次抽样时的入样概率,假设总体中第i个单元的规模度量为,总体的总规模为每次抽样中,第i个单元被抽中的概率用表示,其中这种不等概抽样称作放回的与规模大小成比例的概率抽样(probabilityproportionaltosize),简称PPS抽样。实际问题中,总体单元大小的度量往往不止一个,比如企业员工数量、产值、销售
3、量、利润等都可以度量企业规模的大小。PPS抽样的实施主要有两种方法:代码法和拉希里(Lahiri)法,下面我们用一个实例分别介绍这两种方法。代码数,将代码数累加得到每次抽样都产生一个[1,]之间的随机数,设为m则代码m所对应的单元被抽中。(如果不是整数,则乘以某个倍数。)(1)代码法在PPS抽样中,赋予每个单元与相等的×10累计×10代码123456789100.614.51.513.77.815103.661.16145151377815010036601161511663033815316316677277381~67~151152~166167~3
4、03304~381382~531532~631632~667668~727728~73873.8738____【例5.1】设某个总体有N=10个单元,相应的单元大小及其代码数如下表,我们要在其中产生一个n=3的样本.先在[1,738]中产生一个随机数为354,再在[1,738]中产生第二个随机数为553,最后产生第三个随机493。则它们所对应的第5,7,6号单元被抽中。(2)拉希里法令每次抽样都分别产生一个[1,N]之间的随机数i及[1,]之间的随机数m如果则第i个单元被抽中;否则,重抽一组(i,m).在例5.1中,在[1,10]和[1,150]中分别产
5、生(i,m):(3,121),=15<121,舍弃,重抽;(8,50),=36<50,舍弃,重抽;(7,77),=100≥77,第7号单元入样;(5,127),=78<127,舍弃,重抽;(4,77),=137≥77,第4号单元入样;(9,60),=60≥60, 第9号单元入样。因此,第4,7,9号单元被抽中。2、不放回不等概抽样每次在总体中对每个单元按入样概率进行抽样,抽取出来的样本单元不放回总体,对总体中剩下的单元进行下一次抽样。不放回不等概抽样的效率比放回时的效率高,但是样本不独立会加大抽样实施、参数估计及精度计算的难度。对于不放回不等概抽样,样本
6、的抽取可以有以下几种方法:(1)逐个抽取法。每次从总体未被抽中的单元中以一定的概率取一个样本单元。(2)重抽法。以一定的概率逐个进行放回抽样,如果抽到重复单元,则放弃所有抽到的单元,重新抽取。(3)全样本抽取法。对总体每个单元分别按一定概率决定其是否入样。这种方法的样本量是随机的,事先不能确定。(4)系统抽样法。将总体单元按某种顺序排列,根据样本量确定抽样间距k,在[1,k]中产生一个随机数。§5.2放回不等概抽样一、只抽取一个样本单元(n=1)的不等概抽样为了便于了解不等概抽样的基本思想,我们先看一个总体已知,只抽取一个样本单元的例子。【例】一个城市有
7、四个超市营业面积从100平方米到1000平方米不等(见下表),我们的目标是通过抽取一家超市来估计这四个超市上个月的总营销量。通常超市面积越大则销售量越大,因此,我们选择的入样概率与超市的营业面积成正比。超市营业面积(平方米)(万元)A1001/1611B2002/1620C3003/1624D100010/16245总计16001300四个超市的背景数据:第i个超市的包含概率,:第i个超市的销售量如果超市的营业面积近似正比于超市的销售额,那么超市A的销售额就占所有超市销售额的1/16,因此超市A的销售额乘以权重16(包含概率的倒数)可以近似地估计所有超市
8、的销售额。因此,样本量为1的不等概抽样的总体总值估计量为:式中样本[A]1/16