第5章 不等概率抽样.ppt

第5章 不等概率抽样.ppt

ID:48089825

大小:827.00 KB

页数:94页

时间:2020-01-14

第5章 不等概率抽样.ppt_第1页
第5章 不等概率抽样.ppt_第2页
第5章 不等概率抽样.ppt_第3页
第5章 不等概率抽样.ppt_第4页
第5章 不等概率抽样.ppt_第5页
资源描述:

《第5章 不等概率抽样.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、?--------非概率,等概率,不等概每个单元入样的概率第五章不等概抽样例O’Brienetal.(1995)对Philadelphia地区的病人进行抽样,目的是了解病人对于医疗服务的偏好。目标总体是这一区域的所有注册的医院的病人。总共有294家医院,27652个床位(抽样以前,研究人员只知道床位数,不知道病人数)。等概率的抽取样本医院的缺点?首先,可能医院中愿意接受CPR治疗的病人数量会正比于医院床位的数量,采用等概简单估计量可能会有大的方差。其次,自加权的等概率样本可能难于管理。可能仅仅为了调查一两个病人就需要去一家医院,并且合理分

2、配调查人员的工作负担也是比较困难的。第三,调查成本在调查开始的时候是未知的----一个40家医院的样本可能包括了主要的大的医院,这会导致比预计更大的成本。其他办法?调查人员还可以采用与医院病床数量成比例的方法抽取57个医院,然后从每个样本医院中抽取30个简单随机样本床位。如果病人数等于床位数,并且医院实际的床位数和抽样时依据的病床数据一致,每个病人是否有相同的入样概率?而且成本在调查实施前是已知的,因为每个访员在每个医院访问的病人数量是相同的。而且,总体总量的方差可能更小。分层抽样:抽样选择概率小的单位会有较高的权数。采用不等概率抽样来减

3、少抽样方差而不采用清晰的分层。采用不同的概率来选择初级样本单元,并且在估计中采用不同的权数来进行弥补。抽样的关键是每个样本的选择概率是已知的。5.1不等概抽样一、不等概抽样的必要性:在简单随机抽样中,总体(或层)中的每个单元入样的概率都相等。如果总体中的每个单元在该总体中的地位(或重要性)相差不多,则这种基于等概率的抽样是理所当然的选择。等概率抽样不仅实施简单,而且相应的数据处理公式也简单。但是在许多实际问题中,我们还需要使用不等概抽样(samplingwithunequalprobabilities)。二、不等概率抽样的适用场合:一种情

4、况是调查的总体单元与抽样总体的单元可能不一致;另一种需要用到不等概抽样的情况是,抽样单元在总体中所占的地位不一致;最重要的一种不等概抽样乃是使每个单元入样的概率与该单元的大小成比例的抽样(samplingwithprobabilitiesproportionaltosizes,简称PPS抽样)。二、不等概率抽样的适用场合:第三种需用不等概率抽样的情况是为了改善估计量的特性。每个可能的样本若被抽的概率与样本中单元的辅助变量之和成正比的话,则按此进行不等概抽样所得到的样本,用通常的比估计方法所得的估计量是无偏的。9总之,在实际工作中需要我们经

5、常采用不等概率抽样。另外,从上面列举的情况也可看到,凡需使用不等概抽样的场合,必须提供总体单元的某种辅助信息,例如每个单元的“大小”度量Mi或辅助变量Xi等。10三、不等概抽样的主要分类不等概抽样可按多种原则进行分类。鉴于不等概抽样同时会带来目标量估计及其方差估计的复杂性,可分为放回抽样:每次在总体(或层)中按一定概率抽取一个单元,抽取后放回总体,再进行下一次抽样,每次抽样都是独立的。不放回抽样。其代价是:由于丧失了独立性,无论是抽样方法还是方差估计,都要比放回抽样繁复得多。11另一种分类是:视每次抽样(放回抽样的情形)概率或每个单元的入

6、样概率(不放回抽样的情形)是否严格地与单元的大小成比例。另外,看样本量n是固定的还是随机的。最重要的情形乃是当n固定,且上述概率与单元大小严格成比例的不等概率抽样。以后我们将这种情形的放回抽样称为PPS抽样,称相应的不放回抽样为πPS抽样。12对于不放回抽样,按其样本单元抽取方式的不同又可分为以下几种方法:1.逐个抽取法。每次从尚未入样的单元中以一定概率抽取一个单元,这个概率通常与已经入样的单元有关,2.重抽法。以一定概率逐个进行放回抽样,若一旦抽到重复单元,则放弃所有已抽到的单元而重新抽取,直到抽到规定单元数且所有入样单元都不同为止。B

7、ack133.系统抽取法。将总体单元按某种顺序排列,且将规定的单元入样(或其倍数)累计起来,并确定抽样间隔,在这个范围内产生一个随机数以确定初始入样单元,然后按上述抽样间隔确定其余的样本单元。4.全样本方法。对每个可能样本规定一个被抽中的概率,按这个概率一次抽取整个样本。Back四、不等概抽样的特点不等概抽样的主要优点是:由于使用了辅助信息,提高了抽样策略的统计效率,与简单随机抽样甚至与分层抽样相比,能显著地减少抽样误差。不等概抽样有以下的缺点:1)抽样框中的所有单元,都要有高质量的、能用作大小度量的辅助信息;2)抽样框的创建比简单随机抽

8、样和系统抽样成本高,更复杂,因为需要度量和存储总体中每一个单元的大小;3)并非在任何情况下都能使用,因为并不是每一个总体都有稳定且与主要调查变量相关的有关大小或规模的度量;4)抽样及估计(特别

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。