第21,22课翻译-统计1107-杨凯翔

第21,22课翻译-统计1107-杨凯翔

ID:47202342

大小:5.10 MB

页数:22页

时间:2019-08-25

第21,22课翻译-统计1107-杨凯翔_第1页
第21,22课翻译-统计1107-杨凯翔_第2页
第21,22课翻译-统计1107-杨凯翔_第3页
第21,22课翻译-统计1107-杨凯翔_第4页
第21,22课翻译-统计1107-杨凯翔_第5页
资源描述:

《第21,22课翻译-统计1107-杨凯翔》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、STA333第21章自助法求置信区间(第一部分)21.1准备阶段:理论误差的概念自助法的基本用法之一是对总体参数寻求置信区间,在传统的统计学中需要作假设时,一般而言的方法是固定的,但是如果我们遇到通常的假设被违背的情况时,我们会去尝试估计一些非典型参数,自主化程序可以提供给我们一个对象于参数非参数化的构建置信区间的方法。我在上一节提到过用自助法分布估计实际的样本分布是我们在统计学中正在使用的。那么,打个比方说,我们可以使用自助分布检验正态性。如果样本分布出现正态性并且以实际参数为中心,我们可以使用自助化标准误差计算t分布置信区间。所以,得出结

2、论我们用自助法检验样本分布中心化的表达式和拓展。关于这个结论,自助法不能显示中心化方向,但可显示误差。所谓误差。一项估计参数是否有偏及样本分布能反映被估计的真实参数的指标,统计资料的误差表达式:误差=样本分布均值—参数真实值当然,我们不知道参数真实值,所以不能直接计算误差,但自助法提供允许我们检验误差的方法,观测自助化分布统计量是否中心化于原始随机样本的统计量,自助法估计误差如下:自助法估计误差=自助化分布均值—原始数据统计量◆正态分布使用样本均值的例子。众所周知,样本均值`x总体均值m来说是无偏估计,实际误差为0,举个例子,使用一些随机生成

3、的正态分布数据检验自助法的使用。具体步骤:1.从一个均值,标准差分别为m=22,s=5的正态分布中随机生成一个n=50的样本。2.计算样本均值。3.在这个样本中生成1000个自助法样本,计算每个自助法样本的均值。4.从这个自助法分布中求,使用前面讲的一般方法计算估计误差运行下面程序:运行R程序后,得到的估计误差是0.00497,。重复多做几次,观察得到的结果,由于重复取样,你会得到不同的答案,但应该都接近于0,下图告诉你原因不知其他的统计量是否符合?让我们检验上章中西雅图房屋问题这一例子的中位数估计误差。◆西雅图实际房屋价格。我们对西雅图房屋

4、拥有权感兴趣。不巧的是,从市税务局得到的数据不能很好的区分房屋和商业使用权,由此,我们想知道房屋销售价格的中位数(记住数据在R工作区里的seattlerealestate2002中。)下面估计使用样本中位数估计中位数真实值的误差。我得到了估计误差为-3.9995。多运行几次,你可以清楚地看到使用中位数的系统误差,样本分布低估实际总体中位数产生的误差,下图清楚地显示了,由此,一个合适的置信区间可以使用自助法来弥补估计产生的误差,不久我们就能看到。21.2主要自助法置信区间在传统的(参数)统计学中,一旦你找到样本分布统计量,那么均值的置信区间也会

5、随之确定,一旦你找到了方法,通过找到合适的样本分布中2.5%,97.5%分位点,就可以确定95%置信区间上下限,右图可以说明这点:然后可以计算出固定的置信区间,比如`x±t0.025*s/√n。如何找到非参数置信区间呢?当然,原理本质上相同,除非我们用自助法分布作为估计样本分布的统计量,一旦我们找到自助化分布2.5%和97.5%分位点,我们也就找到了参数95%置信区间,这个区间类型称作自助化百分比置信区间,容易用R中quantile()功能得到。过一小会儿,建立在R上常规自助法自动计算出自助法置信区间,通过R编码,我们也来实现。◆使用均值正态

6、分布的例子,找到一个使用模拟数据的总体均值95%置信区间,下面的事情已知:1.从均值m=22,标准差s=5的正态总体中随机抽出50个观测值,找到实际均值为2,希望他在我们的置信区间中。1.对于总体均值m,`x是其无偏估计量,我们不需要担心误差影响置信区间的结果。2.当正态假设出现而且我们使用的估计值无偏,就可以使用T统计量的置信区间发现自助化结果与一般参数估计结果是否一致、以下是运行程序:得到(19.95,22.44)作为m的95%非参数自助法置信区间,将它与来自于固定的x±t0.025*s/√nT统计量置信区间作对比,容易得到t.text(

7、):覆盖在R输出窗口的是95%参数置信区间的结果(19.92,22.57),可以看出参数与非参数结果是一致的。◆西雅图实际房屋价格。可以找到西雅图2002年房屋销售价格中位数的95%自助化百分比置信区间。使用这种方法,可以得到95%置信度下西雅图2002年房屋所有权销售价格中位数,小贴士:1.在最后的例子中,尝试使用t统计量及自助法找到均值95%置信区间,比较结果并得出结论。2.我们可以提高置信区间的结果,如何?知道中位数是有偏的,我们的方法不能计算这些误差,下一章我们会了解到一种使用自助法估计误差的方法。3.R加入了一个boot程序包可以操

8、作许多类别的自助法问题以及自动计算自助法置信区间,下一节我会使用boot程序包重新解决西雅图房地产问题。◆举例:西雅图实际房屋价格。在这一部分,我重做这个问题,与之

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。