统计学概念和方法-第7章

统计学概念和方法-第7章

ID:36806147

大小:910.81 KB

页数:35页

时间:2019-05-10

统计学概念和方法-第7章_第1页
统计学概念和方法-第7章_第2页
统计学概念和方法-第7章_第3页
统计学概念和方法-第7章_第4页
统计学概念和方法-第7章_第5页
资源描述:

《统计学概念和方法-第7章》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第七章假设检验数学与信息科学学院王坤TEL:13987460215fellowang@163.com统计学概念和方法主要内容作为一个问题的假设:备择假设、回答假设时的错误怎样回答零假设所提出的问题:p值假设检验的机制拒绝或接受零假设显著水平双边检验假设检验和构造置信区间不拒绝零假设意味着什么Excel2007在假设检验方面提供的功能小结问题统计推断包括估计和假设检验。估计的任务是根据样本寻找总体参数值及其范围。那么,这样估计的把握性有多大呢?假设检验的兴趣是对任意一个有关未知分布的假设。假设检验又分为参

2、数检验和非参数检验。参数检验考虑总体参数是否等于某个特定的值。非参数检验是考虑利用子样拟合总体分布。本章只介绍参数检验。例1988年7月28日的纽约时报上刊登了一篇关于人们地理知识的文章。这篇文章描述了一个调查公司的研究结果。研究者们从一些国家抽取许多成年人并请他们鉴别在一个地图上的16个地方,然后把每个人答对的个数加起来。四个国家的样本中答对的个数的均值为美国6.9墨西哥8.2英国9.0法国9.2上述结果是一个样本均值的情况,可以轻易获得样本均值差。那么,总体均值是否有差异呢?7.1作为一个问题的假设

3、在上述问题中,来自墨西哥和美国的总体均值差异是否为零?零假设(原假设)墨西哥与美国的样本均值差为8.2-6.8=1.3,这个值是否超出样本抽样随机性解释范围?为此,我们可以假设总体均值相等,即两个总体的均值之差为零。这就是统计学中的零假设(nullhypothesis)。在这个例子里,零假设就是问这两个总体均值之差是否等于零。记μm为墨西哥的总体均值,μu为美国的总体均值。那么零假设可以写成:H0:μm-μu=0H代表假设,下标0表明是零假设。“零”的意思是假设内容的差异为零。注:希腊字母代表总体参数。

4、零假设就是提出一个参数是否等于某一个特殊值。形式上,零假设写成:H0:参数=值备择假设零假设逻辑上的反面假设是“两个参数的差异不为零”,这种反面假设称为备择假设(alternativehypothesis)。上述例子中,备择假设为:H1:μm-μu≠0显然,零假设H0与备择假设H1不相容。如果样本数据能证明零假设提出的问题应该否定,那么我们就拒绝零假设H0,而倾向于备择假设H1。回答假设时的错误真实状态检验结论接受H0拒绝H0H0为真正确第一类错误(弃真,α错误)H1为真第二类错误(存伪,β错误)正确零

5、假设的问题有两个答案,“是”或者“不是”。但由于样本所携带的信息是来自样本而不是总体,其信息量会受到限制,就有可能提供错误答案。犯两类错误的概率当然是越小越好,但是当样本容量n固定时,α,β不能同时都小,即α变小时,β就变大;而β变小时,α就变大。只有当样本容量n增大时,才有可能使两者同时变小。在实际应用中,人们常遵循Neyman-Pearson原则:在控制犯第一类错误的概率α的条件下,寻找拒绝域(或检验法则),使得犯第二类错误的概率β达到最小。不过,基于Neyman-Pearson原则的最优检验不一定

6、存在。思考一个人因为杀人而受审理。他实际上是有罪的,但法官确认他为无罪。这里零假设是:一个人是无罪的除非你能证明他有罪。则此案中,法官犯的是第一类错误还是第二类错误?法官犯另外一类错误的情形是怎样的?7.2怎样回答零假设所提出的问题为了确定1.3这么大的差异是否属于一类不常见的数据集合,我们计算当总体差别为零时,得到一个大于等于1.3的样本均值之差的概率。这个概率称为p值。当p值很小,以至于几乎不可能在零假设正确时出现目前的样本数据时,我们就拒绝零假设。p值越小,拒绝零假设的理由就越充分。著名统计学家R

7、.Fisher把0.05作为标准,即0.05或者比0.05小的概率被认为是小概率事件。p值p值(pvalue)就是当原假设H0为真时所得到的样本观察结果或更极端结果出现的概率。如果p值很小,说明这种情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,p值越小,我们拒绝原假设的理由越充分。总之,p值越小,表明结果越显著。通常,如果p值<0.05,说明样本结果是统计显著的,拒绝H0。如果p值>0.05,说明结果更倾向于接受假定H0。这里的0.05称为显著水平。假设检验的机制为了求得p

8、值,我们需要把观测到的样本均值之差转换为t=4.25。(这个过程好比把华氏度转换为摄氏度)这里美国的样本包含了1600个观测,墨西哥的样本有1200个观测。这个例子里,对于观测数大于2000的样本来说,t值大于等于4.25的概率是0.00001。即样本均值之差大于等于1.3的概率为0.00001,这个结果是非常非常显著的。注:正态分布N(μ,σ2)自由度为10的t-分布拒绝或接受零假设刚才计算得到的p=0.00001是一个非常非常小的概率。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。