扇贝抽样案例分析

扇贝抽样案例分析

ID:9788447

大小:44.00 KB

页数:7页

时间:2018-05-09

扇贝抽样案例分析_第1页
扇贝抽样案例分析_第2页
扇贝抽样案例分析_第3页
扇贝抽样案例分析_第4页
扇贝抽样案例分析_第5页
资源描述:

《扇贝抽样案例分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、扇贝抽样案例——统计方法的误区  ArnoldBennett是美国MIT斯隆商学院的一名教授,在杂志Interfaces(1995年3月)中描述了最近他作为统计学“专家”提供相关服务的一个法律案例。这个案例涉及一艘远离新英格兰海岸捕捞扇贝的渔船。  为了保护幼扇贝免遭捕捞,美国渔业和野生动物保护机构规定“每个扇贝肉的重量至少1/36磅才可以捕捞”。这艘船被指控违反了这个重量标准。Bennett教授在文章中描述:  这艘船抵达马萨诸塞州的一个港口时装有11000袋扇贝,港务人员随机抽选了其中的18袋来检查。港务人员从每一个袋中随机取出一满勺扇贝,然后算出每个扇贝肉的平均重量。港务抽样方法是什么

2、?人员根据18袋的结果估计这艘船的每个扇贝肉的平均重量为1/39磅,低于标准,于是立即没收了捕获的95%,后来进行了拍卖。  船主不服,对联邦政府提起诉讼,认为自己的捕捞符合标准,认为只选了18袋,不足以代表全体。律师问Bennett教授的问题之一就是:“能够从一个容量18的样本中得到所有扇贝的平均重量的可靠估计吗样本容量应该为多大??”  于是Bennett教授进行了分析:  Bennett教授把被抽样的18袋的每袋的平均重量按照1/36磅为1的情况作了比较,0.93就是比1/36磅轻,1.14就代表比1/36磅重,数量低于1的表明是不符合标准的。  请看下面的数据,只有两袋超过了1/36

3、磅,其他都没有到“1”,都不符合标准。  0.93 0.88 0.85 0.91 0.91 0.84 0.90 0.98 0.88  0.89 0.98 0.87 0.91 0.92 0.99 1.14 1.06 0.93  那么正如律师所问,从11000袋中只抽出18袋作为样本合不合理呢?  结论是不合理:仅用18袋作样本太小了,至少应该在30以上,才能小样本理论适用吗?作为推断的基本证据,否则误差很大。当然抽样中也并不是越大越好,只要样本的抽样方法是科学的,适当的样本便是好的。  现在我把数据还原:  0.0258 0.0244 0.0236 0.0253 0.0253 0.0233 0

4、.0250 0.0272 0.0244  0.0247 0.0272 0.0242 0.0253 0.0256 0.0275 0.0317 0.0294 0.0258  经过我的计算,样本均值为0.0259,样本方差0.0000043777,总体均值在95%置信度下的置信区间为【0.0258791537,0.0258801055】,这个置信区间的长度非常短,原因就是因为样本方差过小;即便是我们把置信度提高为99.9%,置信区间为【0.0258788307,0.0258804286】,其长度依然非常短。然而,置信区间的长度短,正表明了精确性样本方差的大小受到哪些因素的影响?。  注意我要说的“

5、误区”,不在于Bennett教授指出的样本量过小从而抽样结论不可靠的误区(袁卫老师也这样认为),上面计算的数据表明,实际上精确度是非常之高的,精确度高理所当然是可靠的!我要提出我的一个疑问,如果没错的话,那么就是大多数研究抽样问题的人的一个误区——总认为样本量小是导致误差大的主要原因;我认为我们的理解走错了方向。  本案例的精度从何而来?答曰来自于置信区间,而置信区间又直接来自于样本均值的方差,所以我们从样本均值的方差公式来看这个问题,一切自然明了:  用这个公式对吗?  显然,样本均值的方差不仅受样本量n影响,而且受总体方差影响(样本方差是它的无偏估计),当样本方差非常小的时候,n对于估计

6、精度能起多大作用呢?例如本例,样本方差极其小,此时n根本不起多大作用可能有问题哈?;或者,若n大了,样本方差有可能更大,于是可能导致精确度反而降低。由此看来,样本方差对于精度的影响同样是非常大的!  我上面这段话其实也是看似有理,没有说到本质问题上。为什么样本量小就会导致代表性不够、精度低呢?按常理想想,确实是这个道理,但是(我要说的误区所在)我们的解释往往停留在样本均值的方差公式前面的那个系数(1-f)/n上,如果n小,那么这个系数就会大,导致方差大,这个解释是不太合理的(虽然有一定道理),上面已经作出了初步说明,下面我说说我认为是本质的看法:  为什么用正态分布呢?  其实,可能多数人都

7、忽略了一种习以为常的替代——用无偏估计值替代真值。影响样本代表性以及精度的真正原因应该在这个替代上!E(s2)=S2这个替代有问题吗?  注意,无偏估计并不一定等于真值的!而通常由于无偏估计的良好统计学性质,我们就把它当作真值使用了;用样本量n很小的样本求出来的s2与n很大的样本求出来的s2,哪个对S2更具有代表性?若n太小,当然感觉心里不踏实。试想,若抽出所有的样本点,那么样本方差就直接等于总体方差了;若抽

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。