第四章 统计推断.ppt

第四章 统计推断.ppt

ID:48750490

大小:567.00 KB

页数:49页

时间:2020-01-21

第四章    统计推断.ppt_第1页
第四章    统计推断.ppt_第2页
第四章    统计推断.ppt_第3页
第四章    统计推断.ppt_第4页
第四章    统计推断.ppt_第5页
资源描述:

《第四章 统计推断.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第四章统计推断魏玉清2011.4.11上章主要讨论了从总体到样本的关系,本章将讨论从样本到总体的问题,即统计推断问题。所谓统计推断(statisticalinference),就是根据抽样分布律和概率理论,由样本结果(统计数)来推论总体特征(参数)。统计推断的基本内容,包括统计假设检验(hypothesistest)和参数估计(parametricestimate)两个方面。统计推断的主要任务是:分析误差产生的原因,确定差异的性质,排除误差干扰,从而对总体的特征做出正确的判断。假设检验是指根据于某种实际需要,对未知的或不完全

2、知道的统计总体提出一些假设;然后由样本的实际结果,经过一定的计算,作出在概率意义上应当接受那种假设的检验。参数估计是指由样本结果对总体参数作出点估计(pointestimate)或者区间估计(intervalestimate)。第一节假设检验的基本原理一、基本概念假设检验又叫显著性检验(testofsignificance):根据某种实际需要,对未知的或不完全知道的统计总体提出假设(H0和HA,通常构成完全事件系),然后由样本的实际结果经过一定的计算,作出在概率意义上应当接受哪种假设的检验。方法:u检验、t检验、F检验和2

3、检验二、为什么要做假设检验?抽样分布的理论告诉我们,可以用抽样平均数来对总体平均数做出估计,但是,抽样平均数是存在误差的。(1)两个总体间的差异如何比较?一种方法是研究整个总体,即由总体中的所有个体数据计算出总体参数进行比较。特点:很准确,但常常是不可能进行。另一种方法,即研究样本,通过样本研究其所代表的总体。(2)对两个样本进行比较时,必须判断样本间差异是抽样误差(随机误差)造成的,还是本质(总体参数)不同引起的(3)样本平均数包含有试验误差,它只是试验的表面效应。因此,仅凭样本平均数来作出对总体平均数的估计是不可靠的。(

4、4)只有通过显著性检验才能判断样本平均数是否能够代表所研究总体:即分析试验的表面效应主要由处理效应引起,还是主要由试验误差所造成。三、统计假设测验的基本理论依据1、基本理论依据:理论分布“小概率不可能性”原理2、假设测验的基本思想给定一些假设条件,在假设条件下可知无数次独立重复试验中,事件A按预定的概率α发生如果在给定条件下,如果事件A出现的概率α很小,则事件A在一次试验中是几乎不可能发生的如果在一次试验中事件A恰恰发生了,则可以合理的认为原来的假设是不正确的,应该予以否定这一推断犯错误的概率为α我们通过一个例子来介绍假设检

5、验的基本步骤:四、假设检验的基本步骤1、提出假设所谓“零”就是指处理(药剂)没有效果2、确定显著性水平用来否定或接受零假设的小概率标准称为显著性水平,记为α。在生物学研究中,常取α=0.05,称为显著;或α=0.01,称为极显著。注意:假设检验选用的显著性水平应根据实验的要求而定。如果实验中难以控制的因素很多,试验精度不是很高,则显著性水平α的值可稍大点;如果实验的精度很高,真实差异不容易被误差所掩盖,处理的作用容易被检验出来,这时显著性水平α可适当取小些。无论如何,显著性水平α的值必须在实验开始前就已经确定下来。3、计算概

6、率在假定零假设成立的前提下,根据检验统计量的分布,来计算现有样本发生的概率。现有样本发生的可能性可以以u的尾区概率来衡量:越靠近平均数,则尾区面积越大,越容易发生。尾区概率也可以理解成观察到比现有样本更为极端的样本的概率,即P(

7、u

8、>2.526)如果尾区概率小,则说明不容易再观察到比现有样本更为极端的情形,也就是说明现有样本本身就很极端,即它发生的可能性就小。4、统计推断(下结论)若随机事件的概率很小,例如小于0.05或0.01,称之为小概率事件小概率事件不可能原理:小概率事件在一次试验中实际上是不可能发生的。从第3步概率

9、计算中得到,在H0成立的假设下,观察到现有样本的概率是0.0114。如果我们把小概率标准定为0.05(也称为显著性水平),那么现有样本的发生是小概率事件,根据小概率事件实际不可能原理,是不可能得到现有样本的。但是,在我们的实验中确实得到了现有的样本,这只能说明H0成立的前提是错误的。因此,我们在显著性水平为0.05的情况下,否定H0,而接受HA。所以这种药剂对玉米单穗重有显著的影响。例:有一个棉花品种,其棉纤维长度的多年测定结果符合平均为29.3mm,标准差为4.8mm的正态分布,现有一批种子,抽取其中100粒,测得棉纤维长

10、度平均为28.25mm,问该批种子是原棉花品种吗?总体μ0=29.3mmσ2=4.82σ=4.8mm无数次n=100n=100代表性?符合?棉花纤维长度例xxxxx-mx=-1.05mm样本来自不同总体?抽样的随机误差?造成这种差异可能有两种原因,一是品种造成的差异;另一可能是试验误差(或

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。