资源描述:
《多元统计分析第三章假设检验与方差分析.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第3章多元正态总体的假设检验与方差分析从本章开始,我们开始转入多元统计方法和统计模型的学习。统计学分析处理的对象是带有随机性的数据。按照随机排列、重复、局部控制、正交等原则设计一个试验,通过试验结果形成样本信息(通常以数据的形式),再根据样本进行统计推断,是自然科学和工程技术领域常用的一种研究方法.由于试验指标常为多个数量指标,故常设试验结果所形成的总体为多元正态总体,这是本章理论方法研究的出发点。所谓统计推断就是根据从总体中观测到的部分数据对总体中我们感兴趣的未知部分作出推测,这种推测必然伴有某种程度的不确定性,需要用概率来表明其可靠程
2、度.统计推断的任务是“观察现象,提取信息,建立模型,作出推断”。统计推断有参数估计和假设检验两大类问题,其统计推断目的不同。参数估计问题回答诸如“未知参数的值有多大?”之类的问题,而假设检验回答诸如“未知参数的值是吗?”之类的问题。本章主要讨论多元正态总体的假设检验方法及其实际应用,我们将对一元正态总体情形作一简单回顾,然后将介绍单个总体均值的推断,两个总体均值的比较推断,多个总体均值的比较检验和协方差阵的推断等。3。1一元正态总体情形的回顾一、假设检验在假设检验问题中通常有两个统计假设(简称假设),一个作为原假设(或称零假设),另一个作
3、为备择假设(或称对立假设),分别记为和。1、显著性检验为便于表述,假定考虑假设检验问题:设,,…,来自总体的样本,我们要检验假设(3.1)原假设与备择假设应相互排斥,两者有且只有一个正确。备择假设的意思是,一旦否定原假设,我们就选择已准备的假设。当已知时,用统计量在原假设成立下,统计量服从正态分布,通过查表,查得的上分位点。对于检验问题(3。1.1),我们制定这样一个检验规则(简称检验):当时,拒绝;当时,接受。(3.2)我们称为临界值,是的上分位点,不同的临界值代表不同的检验。称拒绝原假设的统计量的范围为拒绝域,称接受的统计量的范围为接
4、受域,因此给出一个检验,就是给出一个拒绝域。2、两类错误由于样本具有随机性,因此在根据样本进行判断时,有可能犯两种类型的错误。一类错误是,原假设本来正确,但按检验规则却作出了拒绝的判断,这类错误称为第一类错误(弃真错误),其发生的概率称为犯第一类错误的概率;另一类错误时,原假设本来不正确,但按检验规则却作出了接收的判断,这类错误称为第二类错误(存伪错误),其发生的概率称为犯第二类错误的概率,记为。同时控制这两类错误是困难的,当时在样本容量固定的条件下,要使和同时减小,通常是不可能的.在假设检验的应用中,由奈曼(NEYMAN)与皮尔逊(PE
5、ARSON)提出了一个原则,即在控制犯第一类错误的概率条件下,尽量使犯第二类错误的概率小,这种检验问题,称为显著性检验问题。根据这一原则,原假设受到保护,不至于被轻易拒绝,一旦检验结果拒绝了原假设,则表明拒绝的理由是充分的,如果接受了原假设,则只是表明拒绝的理由还不充分,未必意味着原假设就是正确的。所以,在实际问题中,为了通过样本观测值对某一猜测取得强有力的支持,通称我们把这一猜测的否定作为原假设,而把猜测本身作为备择假设。3、关于检验的值下面,我们再介绍进行检验的另一种方式——值,我们就以(3.1.1)的检验问题为例来加以说明,对于样本
6、,我们通过统计量,计算出,是一确定值,这里的是样本观测值的均值,再由统计量服从正态分布,计算为检验的值。由于等价于=,所以检验规则可以表述为:当时,拒绝;当时,接受。接受。(3。3)上述值的检验规则与(3。1。2)的检验结果相比含有更丰富的信息,值越小,拒绝原假设的理由就充分。通常SAS等软件的计算机输出一般只给出值,由你自己给定的值来判断检验结果二、单一变量假设检验的回顾1、单个正态总体均值的检验考虑假设检验问题:设,,…,来自总体的样本,我们要检验假设(1)总体方差已知构造统计量在原假设成立下,服从正态分布,可得这样一个检验规则:当时
7、,拒绝;当时,接受。(2)总体方差未知构造统计量在原假设成立下,服从自由度为的分布可得这样一个检验规则:当时,拒绝;当时,接受。(3.1。4)1、两个正态总体均值的比较检验考虑假设检验问题(3。1.5)设是取自总体的容量为的样本,是取自的容量为的样本,给定显著性水平.(1)两个总体方差和已知构造检验统计量(3.1。6)在原假设成立下,服从正态分布,检验规则为:当时,拒绝;当时,接受。(2)两个总体方差和都未知,但==用样本方差代替,构造检验统计量在原假设成立下,服从正态分布,检验规则为:当时,拒绝;当时,接受.2、多个正态总体均值的比较检
8、验(方差分析)设个正态总体分别为,,…,从个总体取个独立样本如下:考虑假设检验问题假设成立条件下,构造检验统计量为:这里称为组间平方和;称为组内平方和;称为总平方和.其中,给定检验水平,查分布