抽样误差与假设检验课件.ppt

抽样误差与假设检验课件.ppt

ID:59449991

大小:3.02 MB

页数:56页

时间:2020-09-18

抽样误差与假设检验课件.ppt_第1页
抽样误差与假设检验课件.ppt_第2页
抽样误差与假设检验课件.ppt_第3页
抽样误差与假设检验课件.ppt_第4页
抽样误差与假设检验课件.ppt_第5页
资源描述:

《抽样误差与假设检验课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第四章抽样误差与假设检验第一节均数的抽样误差与标准误差参数估计和假设检验随机原则总体样本总体参数统计量推断估计参数估计检验假设检验一、抽样误差从总体当中随机抽取一份样本,计算均数。这个均数不同于总体的均数。为什么?再从该总体中随机抽取一份样本,再计算均数。前后两个均数不等。为什么?——抽样误差!例:某市1999年18岁男生身高服从μ=167.7cm、σ=5.3cm正态分布,从该总体中随机抽样。每次抽取10人,得到一个样本均数记为一共抽取100次,就得到了100本样本的均数将上述100个样本均数看成新变量值,这100个样本均数构成了一个新的分布。抽样分布:某一统计量所有可能的

2、样本的取值形成的分布。样本均数抽样分布具有如下特点:1、各样本均数未必等于总体均数;2、各样本均数间存在差异;3、样本均数围绕总体均数呈正态分布;4、样本均数变异范围较原变量变异范围大大缩小,这100个样本均数的均数为167.69cm,标准差为1.69cm。在非正态分布总体中可进行类似抽样。可得到如下结论:若变量服从正态分布,则各样本均数也服从正态分布。若变量不服从正态分布,当样本量足够大时,各样本均数近似服从正态分布,当样本量很小时,则样本均数为非正态分布。样本均数的总体均数为μ,而样本均数的标准差比原来个体值的标准差要小,为区别两者,我们用来表示,其计算公式为(标准误)

3、反映样本均数间的离散程度。(标准误的估计值)例12000年某研究所随机调查某地健康成年男子27人,得到血红蛋白的均数为125g/L,标准差为15g/L。试估计该样本均数的抽样误差。标准差与标准误的区别与联系标准差:描述个体值间的变异,标准差较小,表示观察值围绕均数的波动较小,说明样本均数的代表性就越好。标准误:描述样本均数的抽样误差,标准误较小,表示样本均数与总体均数较接近。说明样本均数的可靠性。用途标准差:表示变量值离散程度的大小,结合均数估计参考值范围。标准误:表示抽样误差的大小,估计总体均数的可信区间。与样本含量的关系标准差:随样本含量的增多,逐渐趋于稳定标准误:随样

4、本含量的增多逐渐减小。联系1、标准差与标准误都是变异指标,说明个体值之间差异是用标准差,说明样本均数之间差异时用标准误。2、当样本含量不变时,标准差越大,标准误越大。标准差和标准误的区别随机变量XN(m,s2)标准正态分布N(0,12)Z变换标准正态分布N(0,12)均数Studentt分布自由度:n-1t分布一、t分布的概念从正态总体N(μ,σ2)中进行无数次样本含量为n的随机抽样,每次均可得到一个和一个S,通过公式转换,可得无数个t值,t值的分布即为含量为n的t值的总体或称t-分布。t值的分布与自由度有关(实际是样本含量n不同)。t分布的图形不是一条曲线,而是一簇曲线

5、。t分布曲线是单峰分布,以0为中心,左右两侧对称曲线的中间比标准正态曲线(Z分布曲线)低,两侧翘得比标准正态曲线略高。t分布曲线随自由度υ而变化,当样本含量越小(严格地说是自由度υ=n-1越小),t分布与Z分布差别越大;当逐渐增大时,t分布逐渐逼近于Z分布,当υ=∞时,t分布就完全成正态分布。t分布曲线是一簇曲线,而不是一条曲线。t分布下面积分布规律:查t分布表。t-分布曲线下面积为1二、t分布的图形和t分布表t分布曲线特点:同标准正态分布曲线一样,统计应用中最为关心的是t分布曲线下的尾部面积(即概率p)与横轴t值间的关系。为使用方便,统计学家编制了不同自由度v下的t界值表

6、(附表2)。在t界值表中,横标目为自由度v,纵标目为概率p。表中数字表示当v和p确定时,对应的t临界值(criticalvalue)。t分布表该表中分别给出了单侧概率和两侧尾部面积之和的双侧概率所对应的t临界值。单侧概率相对应的t临界值用符号表示。双侧概率相对应的t临界值用符号表示。例如:当单侧概率p=0.05时,v=16,单侧当双侧概率p=0.05时,v=16,双侧α/20(b)-tα/2tα/2α/2单双侧t分布示意图Tα为单侧临界值Tα/2为单侧临界值0(a)αtα在相同自由度时,值越大,概率p越小;从t界值表中亦可看出:而在相同t值时,双侧概率p为单侧概率p的两倍。

7、即:第四章抽样误差与假设检验第一节均数的抽样误差与标准误差统计推断包括参数估计和假设检验。参数估计就是用样本指标(统计量)来估计总体指标(参数)。第二节总体均数的估计参数估计点估计(pointestimation)区间估计(intervalestimation)一、参数估计的概念,即认为2000年该地所有健康成年男性血红蛋白量的总体均数为125g/L。1.点估计:用样本统计量直接作为总体参数的估计值。例如于2000年测得某地27例健康成年男性血红蛋白量的样本均数为125g/L,试估计其总体均数。按预先给定的概率(1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。