资源描述:
《抽样调查-5不等概率抽样》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、抽样调查(SamplingSurvery)李启才liqcai@njnu.edu.cnChap5不等概率抽样§5.1不等概率抽样抽样调查§5.2放回不等概率抽样§5.3多阶段有放回不等概率抽样§5.4不放回不等概率抽样§5.1不等概率抽样由于抽样单元在总体中占有的地位不一样,有时需赋予每个单元不同的被抽中概率,以便更合理的推算估计。例如反映北京经济发展的情况,像首钢等这样的大型企业影响比较大,而一些名不见经传的小企业是否抽中往往无足轻重。因而在抽样中如果把他们处在同等地位显然有缺陷。不等概率抽
2、样主要分为(一)放回不等概率抽样和(二)不放回不等概率抽样。它们在抽样方式和估计量构造方面都与前面有很大不同。在有放回等概率抽样中,最常用的是按总体单元的规模大小来确定抽选的概率。1PPS抽样(probabilityproportionaltosize)设Z1,Z2,…Zn是一组概率分布(分布列),按这组概率对总体中的N个单元进行有放回抽样,每次抽中第i个单元的概率Zi,独立进行n次,则这种抽样叫多项抽样.特别地,设总体种第i个单元的规模度量为Mi,可取这时称为PPS抽样。其中某单元可能被不止一次抽中,此时只
3、调查一次,但计算时出现几次按几次计算。2实施办法1).代码法(累积总和法)(汉森&赫维茨,Hansen&Hurwitz1943)在PPS抽样中,赋予每个单元与规模Mi相等的代码,将代码累加得到M0,每次抽样都产生一个[1,M0]之间的随机数,设为m,则代码m所对应的单元被抽中.如果Mi不是整数,则乘以某个倍数.单元单元规模累加和代码范围123...M1M2M3...M1M1+M2M1+M2+M3...1—M1M1+1—M1+M2M1+M2+1—M1+M2+M3...例5.1设某个总体有N=10个单元,相应单元
4、的大小Mi及代码,我们要在其中产生一个n=3的样本.iMiMi*10累加Mi*10代码12345*6*7*89100.614.51.513.77.815103.661.16145151377815010036601161511663033815316316677277381~67~151152~166167~303304~381382~531532~631632~667668~727728~738和M0=73.8738--------先在[1,738]中产生第一个随机数如是354,再在[1,738]中产生第二
5、个随机数如是553,最后[1,738]中产生第三个随机数如是493,则它们对应的第5,6,7号单元被抽中。易验证每个单元被抽中的概率与其规模成正比。2)拉希里方法(Lahiri,印度)第一步:先在1~N中随机等概率抽取一个数字,不妨设为i,则i成为侯选的被抽中单元,其是否抽中还依赖于第二步;第二步:令,在之间等概率随机取m,如果m小于刚才抽中第i个单元的规模Mi,即m≤Mi,则第i个单元被抽中,否则重复第一步和第二步,直到两步都符合才算抽中,这样依次下去,直到抽满n个单元为止.续上例:在[1,10]和[1,1
6、50]中分别产生(i,m)演示如下,(3,121),舍弃,重抽;(8,50),舍弃,重抽;(7,77),第7号单元入样;(5,127),舍弃,重抽;(4,77),第4号单元入样;(9,60),第9号单元入样.因此第4,7,9号单元被抽中。注:总体单元大小规模的度量往往不止一个,如度量一个企业的大小,可以是资金多少,也可以是产值和销售额的大小,还可以使人员的多少等。如估计全乡村平均年收入,可以以每村家庭户数作为规模度量。实际调查中,应据与调查的目标量Yi的相关程度以及获取数据简易程度综合考虑。iMi累加Mi代码
7、12345678910120452108628419139320167381201653754617459369751295146215001~120121~165166~375376~461462~745746~936937~975976~12951296~14621463~1500和1500--------3不放回不等概率抽样对于放回抽样,总体参数的估计及其方常估计比较简单,但样本单元中可能有单元被抽中多次,直观上,同一单元没有必要调查多次。因此可以考虑不放回不等概率抽样,即每次在总体中对每个单元按入样概
8、率进行抽样,抽取后不再放回,对总体中剩下的单元进行下一次抽样。不放回概率抽样比放回概率抽样效率高,但难以实施,参数估计及精度计算比较困难。不放回不等概率抽样后述。包含概率:总体中第i个单元被包含到样本的概率用πi表示(πi=nZi)§5.2放回不等概率抽样[例]一个城市有4个超市,营业面积从100平方米到1000平方米不等(见表5-2)。我们的目标是通过抽取一家超市来估计这个4个超市上个月的总销售量