总体特征抽样调查的设计与分析论述.ppt

总体特征抽样调查的设计与分析论述.ppt

ID:51081595

大小:207.00 KB

页数:37页

时间:2020-03-18

总体特征抽样调查的设计与分析论述.ppt_第1页
总体特征抽样调查的设计与分析论述.ppt_第2页
总体特征抽样调查的设计与分析论述.ppt_第3页
总体特征抽样调查的设计与分析论述.ppt_第4页
总体特征抽样调查的设计与分析论述.ppt_第5页
资源描述:

《总体特征抽样调查的设计与分析论述.ppt》由会员上传分享,免费在线阅读,更多相关内容在PPT专区-天天文库

1、第十五章总体特征抽样调查的设计与分析主要内容单纯随机抽样系统抽样分层随机抽样第一节单纯随机抽样例15-1某地区共有250名社区医生,一个研究组从名单中随机抽取90名进行调查,发现他们一个月内家访平均次数为4.89,标准差为3.48;其中有40位是医科大学毕业。试估计当地一个月内平均每位社区医生的家访平均次数、全体社区医生的家访总次数以及社区医生中大学毕业者所占的百分比。单纯随机抽样单纯随机抽样(simplerandomsampling)。一个月内平均每位社区医生家访的平均次数约为4.89全体社区医生家访的总次数约为4.89×250=1222.5社区医生中大学毕业者所占的百分比约为(40/90)

2、×100%=44.4%单纯随机抽样连续型变量总体均数的估计无限总体(infinitepopulation)从正态分布总体,则样本均数的标准误为总体均数u的可信区间单纯随机抽样有限总体(finitepopulation)样本均数的标准误:可信区间:有限总体校正因子抽样频率单纯随机抽样例15-1:总体均数u的95%置信区间:单纯随机抽样总体中所有X值之和的置信区间可以用u的置信区间乘以N倍来估计,即全体社区医生一个月内家访总次数的95%置信区间:单纯随机抽样0-1变量总体概率的估计二项分布无限总体:已知在含有n个个体的独立随机样本中,有y个个体具有某种特定属性,则该属性的样本频率样本频率变异性的标

3、准误:单纯随机抽样有限总体:总体概率的置信区间:单纯随机抽样例15-1:当地全体社区医生一个月内家访的总次数约介于1077.5和1367.5之间,平均每位社区医生家访的平均次数约介于4.31和5.47之间;而社区医生中,大学毕业者所占的百分比则约介于36.2%和52.6%之间。单纯随机抽样样本量的估算样本量估算的依据样本量的信息:1.总体中个体的变异程度如果个体间变异程度小,则所需样本量也较少;通常用变异系数V来反映个体间变异。2.精度通常用最大的相对误差反映精度的要求,是最终估计范围的半宽度与真值之比。精度要求越高,样本含量就越大。3.置信程度即置信水平反映置信程度。置信程度越高要求的样本含

4、量也越大。单纯随机抽样连续型变量总体均数估计的样本量需准备如下信息:1.变异系数V即总体标准差与总体均数之比2.相对误差由研究者根据问题的背景自行规定。3.置信水平也由研究者根据问题的背景自行规定。通常取90%,95%,99%。如果取99.7%,理论上认为这时的置信区间基本上覆盖真值,所以称之为“实质上肯定”(virtualcertainty)的水平,此时标准正态分布的临界值单纯随机抽样最小样本量的公式为续例15-1,将已获得的90名社区医生的资料视为预调查单纯随机抽样关于社区医生家访次数的估计,欲使相对误差不超过20%,而保持置信水平为95%,至少需要调查49名社区医生。比由此,为了估计平均

5、家访次数,预调查90名社区医生的资料已经足够了。还少?需要说明的是,如果算出的最小样本量n超过了总体内个体数N,则最小样本量就应该是N,即需要作全数调查。单纯随机抽样0-1变量总体概率估计的样本量事先需知(1)总体概率的猜测值P可以通过预调查的资料来粗略估计。(2)相对误差由研究者根据问题的背景自行规定。(3)置信水平也由研究者根据问题的背景自行规定概率的变异系数的计算公式为最小样本量的公式为关于社区医生中大学毕业者所占百分比的估计,欲使相对误差不超过20%,而保持置信水平95%,至少需要调查121名社区医生。系统抽样系统抽样需要事先为总体中的个体编号。如果欲调查的变量值或特定的属性与编号之间

6、没有确定的上升、下降或周期性关系,这时可以按单纯随机抽样的办法来估计参数和估算样本量。如果个体的编号不具有随机性,就应考虑采用其它的抽样设计和相应的统计方法。第二节分层随机抽样例15-2欲抽样调查某医院病人的药费开支和自费病人所占频率。决定将病人分为内科、外科、妇科、儿科和其他5个“层”;将每一层视为一个小总体,在每一层内作随机抽样。已知一天内5个层的门诊人次数分别:N1=2800,N2=900,N3=700,N4=400,N5=200,总的人次数n=5000,总的样本数n=1000,抽样的比例为n/N=0.2。于是,5个“层”中抽出的样本量分别:n1=560,n2=180,n3=140,n4

7、=80,n5=40。按单纯随机抽样的计算方法,得到各个层内每人次门诊药费开支(元)的样本均数分别样本方差分别为各个层内完全自费者的频率分别为分层随机抽样分层随机抽样(stratifiedrandomsampling)。此时可简单估计该医院病人平均每人次门诊的药费开支(元)约为门诊病人中完全自费者所占频率约为点估计,需要进行区间估计,其关键仍是估计标准误分层随机抽样连续型变量总体均数的估计各层的抽样

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。