欢迎来到天天文库
浏览记录
ID:45788059
大小:351.00 KB
页数:88页
时间:2019-11-17
《样本量的确定》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、样本量的确定北京广播学院新闻传播学院调查统计研究所二零零一年五月沈浩本讲主要内容如何计算简单随机抽样的样本量确定如何实现分层抽样中各层样本单位数的分配样本容量的确定样本量=费用+精度(函数)确定样本容量,需要处理好预定的精度与现有经费,同时也要考虑资源和时间等限制条件,最终的样本量确定是在上述因素之间的权衡关系。分层抽样分配样本的标准总的样本容量事先确定估计值要求达到的精度预先给定影响调查样本容量的因素调查估计值所希望达到的精度调查估计值所能允许的误差。估计量的抽样方差较小,估计值是精确的估计值的精度越高,所需的样本容量就越大影响精度的因素也同样影响着样本容量的大小所研究指标在总体中的变
2、异程度总体的大小样本设计和所使用的估计量无回答率客户提供的经费能支持多大容量的样本整个调查持续的时间有多长调查需要多少访员能招聘到的访员有多少除了估计值的精度以外,调查实际操作的限制条件也许是影响样本容量的最大因素。1.给定精度水平下样本容量的确定样本容量的大小与调查估计值所要求的精度紧密相关数据是通过抽样而不是普查收集的,就会产生抽样误差。精度是由抽样方差来测量的。随着样本容量的增加,调查估计值的精度也会不断提高。标准误差误差界限变异系数抽样方差的几种计量方法抽样调查中样本容量的确定,也经常会使用一种或多种这样的计量方法来对精度进行说明。非抽样误差非抽样误差会对调查估计值的精度产生显著
3、的影响非抽样误差的大小与样本容量的大小却没有很大的关系确定样本容量,就不必将这些误差作为影响因素加以考虑为确保调查结果的准确性,应该消除非抽样误差,至少应尽可能使之最小化由于我们将在某一给定误差界限下,阐述样本容量确定的过程,所以有必要复习一下置信区间的概念。对于具有正态分布的估计量来说,95%的置信区间意味着在同样的条件下,反复抽样100次所得的100个样本中,有95个样本的估计值所确定的区间包含总体真值,这个区间以样本的估计值为中心,半径为1.96倍的标准误差。置信区间2.误差界限误差界限是标准误差的倍数标准误差是估计量抽样方差的平方根乘数因子取决于在调查估计中所希望达到的置信水平(
4、或称置信度)对于估计值t,在给定其标准误差t的情况下,置信区间的公式可以表示为:(t-ztt+zt)这里zt是误差界限,z是对应于某一置信水平的标准正态分布的分位点值该z值可从标准正态分布表中查得,大多数统计学教材中都附有这样的统计表常用的z值包括对于90%的置信度,对应的z值为1.64对于95%的置信度,对应的z值为1.96对于99%的置信度,对应的z值为2.563.多大的抽样方差是可接受的调查估计值能容忍多大的不确定性?。常用的95%的置信度、±5%的误差界限对我们的调查目标是否适宜估计值是否需要更高(或更低)精度如果调查结果将用于进行一项有重大意义或有较大风险的决策,那么,
5、估计值可能需要较高的精度;如果我们只是简单地希望取得所研究总体某个特征的感性认识,那么,稍低一点的精度就可以满足要求了多大抽样方差是可以接受是否需要对调查的子总体(或称作域)进行估计?调查结果可能需要包括一些细分的数据这些数据称为子总体估计值(或域估计值)为使数据满足调查要求,应该确定合适的精度与调查估计值有关的抽样方差有多大?对于不同的子总体,对精度的要求可能有所不同例如,在一次全国范围的抽样调查中,对国家层次的数据,调查主办者可能需要±3%的误差界限;但对于省级层次的估计值,±5%的误差界限可能就可以满足要求;而对于省级以下层次的估计值,±10%的误差界限可能就足够了。在这种情况下,
6、通常对每个研究域都进行分层,并单独计算各层的样本容量将各个研究域中所有层的样本容量相加,便得到了调查所需的总样本容量调查估计值有关的抽样方差有多大为达到调查结果要求的精度,最小的调查估计值是什么?假设我们进行比例估计。其中,一些指标的比例可能是P=50%或更高,但是其它指标的比例则可能较低,如P=5%或者P=10%事实上,P可以是P=0到P=1.0之间的任一数值。在确定调查估计值所需的精度时,应该考虑当某个既定精度达到时所得的最小估计值。如果最小的估计值是P=5%,那么误差界限就应该小于5%。例如:某公司决定,如果公司所在的地区中,至少有P=4%的人群对某一种产品存在需求,那么该公司就决
7、定生产这种产品。因此,该公司的市场调研部准备对当地的居民一项调查,以便估计他们在这种产品上的消费需求。对于P=4%±5%水平左右的调查估计值就不太合适,应规定更小的误差界限,如小于或等于±0.01、±0.02等,这时候置信区间应该是(0.05±0.01)或(0.05±0.02)。Table1样本容量和在P=0.5时运用简单随机抽样估计P值得到的误差界限样本容量误差界限500.141000.105000.04510000.032最佳的
此文档下载收益归作者所有