欢迎来到天天文库
浏览记录
ID:34417676
大小:266.84 KB
页数:16页
时间:2019-03-05
《15 总体特征抽样调查的设计与分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第十五章总体特征抽样调查的设计与分析[教学要求]了解:一阶段整群抽样时连续型变量总体均数和连续型两变量比值的估计及其样本量的估算方法。熟悉:单纯随机抽样、系统抽样和分层随机抽样时样本量的估算方法。掌握:单纯随机抽样、系统抽样和分层随机抽样时总体均数和概率的估计方法。[重点难点]本章主要包括两部分内容:四种抽样方法对应的参数估计和样本量。其基本计算公式是一致的,不同之处在于各种抽样方法下样本均数及其标准误以及样本频率的标准误的计算方法不同。基本公式具体如下:一、连续型变量总体均数μ的估计点估计:X区间估计:X±tSE(X),或X±ZSE(X)(大样本时)α,2/n−1α2/总体中个体值之和的置
2、信区间N[X±tSE(X)]或N[X±ZSE(X)](大样本α,2/n−1α2/时)二、0-1变量总体概率π的估计点估计:p区间估计:p±ZSE(p)(大样本时)α2/三、样本量的估算(一)样本量估算的依据1.总体的变异程度:连续型变量考虑变异系数V,V越大则样本量也越大;0-1变量则考虑总体概率π,π离0.5越近则样本量越大。实践中,常用样本频率P代替π。2.精度:相对误差ε,由研究者根据问题的背景自行规定,ε越大则样本量越小。3.置信程度:置信水平1−α,由研究者根据问题的背景自行规定,1−α越大样本量也越大。2⎛ZV⎞⎜α2/⎟(二)连续型变量总体均数估计的样本量n=⎜⎟⎝ε⎠2Z1(
3、−P)α2/(三)0-1变量总体概率估计的样本量n=2εP注意:如果计算得到的最小样本量n超过了总体内个体数N,则需要作全数调查。第一节单纯随机抽样和系统抽样22∑X∑∑X−(X)/n一、连续型变量:均数X=,标准差S=nn−1SxnSx标准误:无限总体SE(X)=;有限总体SE(X)=1−nNn注意:受抽样频率n/N的影响,有限总体样本间的变异性比无限总体样本间的变异性小。X变异系数V=SY二、0-1变量:样本频率p=np1(−p)p1(−p)样本频率的标准误:无限总体SE(p)=≈n−1nnp1(−p)有限总体SE(p)=1−Nn−1第二节分层随机抽样基本思想:先分别按层计算样本统计量(
4、包括各层均数和均数的方差,或样本频率和样本频率的方差),总的样本统计量就是对应的各层统计量按层大小的加权平均值。一、连续型变量LNLh2样本均数X=∑WhXh,Wh=标准误SE(X)=∑WhSE(Xh)h=1Nh=122⎛nh⎞⎛Sh⎞其中X为各层样本均数,SE(X)=⎜1−⎟⎜⎟为各层均数的方差,此时自由度hh⎜N⎟⎜n⎟⎝h⎠⎝h⎠LL为df=∑dfh=∑(nh−)1=n−L。h=1h=1σwx2变异系数V=,其中μ和σ分别用上述的X和SE(X)估计。wxhμ二、0-1变量LL22样本频率p=∑Whph,样本频率的方差SE(p)=∑WhSE(ph)h=1h=12⎛⎜nh⎞⎟⎛⎜ph1(−
5、ph)⎞⎟其中p为各层样本频率,SE(p)≈1−为各层样本频率的方差。hh⎜N⎟⎜n−1⎟⎝h⎠⎝h⎠*第三节一阶段整群抽样基本思想:在M个群(共N个个体)中抽样观察m个群,以群为单位进行参数估计。一、连续型变量总体均数与总和的估计1.以群为单位:m2∑(Xi−Xclu)∑X2i=1样本均数X=,群间方差S=,df=m-1cluxmm−1mSx均数的标准误SE(X)=1−cluMm总体均数的1(−α)置信区间为X±tSE(X)cluα,2/m−1cluσx2变异系数V=,其中μ和σ用上述以群为单位的样本均数和群间方差估计。xxμxN2.以个体为单位总体均数的1(−α)置信区间[X±tSE(X
6、)]cluα,2/m−1cluM3.总和的1(−α)置信区间M[X±tSE(X)]cluα,2/m−1clu二、两个连续型变量比值的估计设有两个连续型变量X和Y,从M个群中随机抽取m个群,并调查其全部,得到变量X和Y在各群内观察值之和及总和{(X,Y),(X,Y),...,(X,Y),(X,Y)},1122mmYcluY两个连续型变量之比r=r=cluXXclu22⎡SE(X)⎤⎡SE(Y)⎤⎡SE(X)⎤⎡SE(Y)⎤cluclu2ˆcluclu标准误SE(r)=(r)⎥+⎥−ρ⎥cluclu⎢⎢⎢⎥⎢XYXY⎣clu⎦⎣clu⎦⎣clu⎦⎣clu⎦其中ρˆ为变量X和Y的相关系数。比值1(
7、−α)置信区间r±tSE(r)cluα,2/m−1clu1⎡2σ2σσ⎤21σxyxy比值的变异系数V=⎢2+2−2ρ⎥R⎢⎣μxμyμxμy⎥⎦[案例讨论参考答案]案例15-1研究者采用的分层随机抽样的方法是适宜的,但是一开始就用单纯随机抽样资料的分析方法进行统计分析,这样就体现不了分层的意义。正确的分析:已知各层的个体数和样本量分别为N=840,N=360,n=28,n=12。12122812两层的相对大
此文档下载收益归作者所有