资源描述:
《《抽样技术》第六章.ppt》由会员上传分享,免费在线阅读,更多相关内容在PPT专区-天天文库。
1、《抽样技术》第六章王学民编1第六章不等概率抽样§6.1概述§6.2放回不等概率抽样§6.3不放回不等概率抽样2§6.1概述当Y1,Y2,⋯,YN之间的大小相差很大时,S2也将很大。此时可考虑分层,但更为精细的方法是使用不等概率抽样。3在不等概率抽样中,每个单元都被赋予一个大小不等的入样概率,而这个概率通常与某个辅助变量有关,如表示单元规模(大小)的某种度量。不等概率抽样的常见应用情形:总体单元规模相差很大。整群抽样和多阶抽样中,若初级单元相差很大。系统抽样。不等概率抽样的主要优点:可以大大提高估计的精度,减少抽样误差。
2、一个必要条件:对总体中的每一个单元,都要已知一个辅助量用以确定其入样概率或两个单元同时入样的概率。4§6.2放回不等概率抽样一、多项抽样与PPS抽样二、多项抽样的实施方法三、汉森一赫维茨估计量及其性质5一、多项抽样与PPS抽样多项抽样总体:Y1,Y2,⋯,YN入样概率:Z1,Z2,⋯,ZN放回抽样n次,共抽到n个单元。取Zi=Mi/M0,其中Mi是第i个单元的大小,此时每个单元在每次抽样中的入样概率与单元大小成比例,称这种特殊的多项抽样为(放回的)与大小成比例的概率抽样,简称PPS抽样。6二、多项抽样的实施方法1.代码
3、法2.拉希里法71.代码法例6.1设某个总体有N=10个单元,欲用多项抽样从中抽取n=5个单元,给定的入样概率{Zi}。令Mi=100Zi,则其皆为整数,对Mi累加,赋以每个单元的代码列在下表中。在[1,100]内产生5个随机数:04,73,25,49,82。82.拉希里法令,每次抽取一个[1,N]范围内的随机数i及[1,M*]范围内的随机数m,若Mi≥m,则第i个单元入样;否则重抽一组(i,m)。在例6.1中,N=10,M*=24。设[1,10]中的一个随机数为4,[1,24]中的随机数为9,由于M4=6<9,故重抽
4、。设第二次抽到的一组随机数为(7,15),则仍然不满足要求,还需要抽。若再次抽到的随机数组为(2,8),则由于M2=10>8,故第2个单元被抽中。如此重复直到抽到n个单元(允许重复)为止。拉希里法适用于N很大的情况。9三、汉森—赫维茨估计量及其性质汉森—赫维茨(Hansen-Hurwitz)提出的对总体总和Y的估计如下:汉森一赫维茨估计量具有如下性质:若所有的Zi>0,i=1,2,⋯,N,则1.,即它是无偏的;2.3.若n>1,则是的无偏估计。10例6.2下表是某系统全部N=36个单位上一年职工人数Xi及当年职工人数Y
5、i的数据。以Xi为单位大小Mi的度量,对单位进行PPS抽样,n=6,估计全系统当年职工总人数Y,并与简单随机抽样作精度比较。1112§6.3不放回不等概率抽样一、包含概率与πPS抽样二、霍维茨—汤普森估计量及其性质三、n=2的严格πPS抽样13一、包含概率与πPS抽样在不放回抽样中,每个单元Yi被包含到样本的概率πi=P(i)及任意两个单元(Yi,Yj)都包含到样本的概率πij=P(i,j)通称为包含概率。抽取了n个单元的样本。包含概率πi与πij满足以下性质:1.2.3.14最感兴趣的是πi与单元大小Mi成比例的情形
6、。若仍记Zi=Mi/M0,则有:πi=nZi这种不放回的与(单元)大小成比例的概率抽样称为πPS抽样。严格的πPS抽样实施起来非常复杂。事实上,只有当n=2时,才有一些简单且实用的方法。对于n>2,严格的πPS抽样都相当复杂。对于大的n,有时根本不可能。除了实施方面的原因外,当n大时,πij的计算也极其困难,而这对于方差估计是不可少的。15二、霍维茨—汤普森估计量及其性质对不放回的不等概率抽样,霍维茨(Horvitz)与汤普森(Thompson)提出了以下总体总和Y的估计量:对于πPS抽样,由于πi=nZi,与相应PP
7、S抽样的形式上完全一致。若πi>0,i=1,2,⋯,N,则是Y的无偏估计,且它的方差为:16又有若πi>0,πij>0(i,j=1,2,⋯,N,i≠j),则是的无偏估计。也是的无偏估计。17三、n=2的严格πPS抽样1.布鲁尔(Brewer)方法2.德宾(Durbin)方法18第一个样本单元以概率Zi抽取,设抽到的是单元i;第二个样本单元按与Zj成比例的概率(即Zj/(1−Zi))抽取,则此时,πi不与Zi成正例。191.布鲁尔(Brewer)方法该方法要求对每个i,都满足。两个样本单元采用逐个抽取法抽取:第一个单元按
8、与成比例的概率抽取;第二个单元则在剩下的N−1个单元中按与Zj成比例的概率抽取。202.德宾(Durbin)方法两个样本单元仍用逐个抽取法抽取。第一个样本单元以概率Zi抽取,设抽到的是单元i;第二个样本单元则按与成比例的概率抽取。德宾方法与布鲁尔方法是等价的。21