资源描述:
《第07章方差分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、第7章方差分析摘要:多组资料均数比较一般采用方差分析的方法,SAS中方差分析的功能非常全而,能实现方差分析功能的过程有ANOVA过程和GLM过程。对于两个平均数的假设测验,一般采用(测验来完成,对■于多个平均数的假设测验,若采用t测验两两进行,不仅非常麻烦,而且容易犯第一类错谋。方差或称均方,即标准差的平方,它是一个表示变异程度的量。在一项试验或调查中往往存在着许多种影响生物性状变异的因素,这些因素冇较重要的,也冇较次要的。方差分析就是将总变界分裂为各个因素的相应变界•,作出其数量估计,从而发现各个因素在变界中所占的重要程度;而且
2、除了可控制因素所引起的变界后,其剩余变异乂可提供试验谋差的准确而无偏的估计,作为统计假设测验的依据。当试验结果受到多个因素的影响,而且也受到每个因素的各水平的影响时,为从数量上反映各因素以及各因素诸水平对试验结果的影响,可使用方差分析的方法。SAS系统用于进行方差分析的过程主耍有ANOVA过程和GLM过程,对于均衡数据的分析一般采用ANOVA过程,对于非均衡数据的分析一般采用GLM过程。方差分析和协方差分析在SAS系统中由SAS/STAT模块來完成,其屮我们常用的有ANOVA过程和GLM过程。前者运算速度较快,但功能较为有限;后者
3、运算速度较慢,但功能强大,我们做协方差分析时就要用到GLM过程。本章将首先介绍方差分析所用数据集的建立技巧,然后重点介绍这两个程序步。§7.1方差分析概述一、方差分析的应用场合、基本思想和前提条件1.应用场合当影响因索是定性变量(一般称为分组变量或原因变量),观测结果是定量变屋(一般称为结果变量或反应变虽:),常用的数据处理方法是对均数或均值向量进行假设检验。若只有一个原因变量,而且其水平数kW2,—元时常用U检验、t检验、秩和检验,多元时用多元检验(T?检验或wilks'人检验);若原因变量的水平数k23或原因变量的个数M2,—
4、元时常用下检验,也叫一元方差分析(简写成ANOVA)或非参数检验,多元吋用多元方差分析(简写成MANOVA,其中最常用的是Wilks'八检验)。2.基本思想方差分析的基本思想可概述为:把全部数据关于总均数的离均差平方和分解成几个部分,每一部分表示某一影响因素或诸影响因素之间的交互作用所产生的效应,将各部分均方(即方差)与误差均方和比较,依据下分布作出统计推断,从而确认或否认某些因素或交互作用的重耍性。由于试验设计的类型多种多样,不同的设计类型往往需用不同的方差分析模型去处理,因此,用來作为度量影响因素作用人小的尺子——误差的均方,
5、也就不是i成不变的了。这就出现了误差固定的设计类型及其定量资料的统计分析方法和误差变动的设计类型及其定量资料的统计分析方法。1.前提条件无论是进行ANOVA还是MANOVA,严格他说,都要求资料满足正态性和方差齐性的。要求,但方差齐性冇时较难满足,此时可采用冇关的非参数检验或对数据作某种变换后使Z满足前提条件。此处仅给出一元情形吋,如何用SAS程序实现对资料的正态性和方差齐性检验。例7.1为了研究轻度和重度再障贫血患者血清小可溶性CD,抗原水平(U/ml)与正常人有无显著性差别,以反映患者免疫状态紊乱而导致造血功能障碍的程度。从三
6、种人群中分别随机地抽取了10人,测得CD8抗原水平如下,试对下列三组资料作正态性和方差齐性检验。正常组:234,318,402,382,621,408,243,141,42,98o轻度组:509,518,555,758,845,712,585,448,753,896o重度组:851,562,918,631,653,843,659,849,762,901o【分析与解答】①关于正态性检验:Ho:三组资料分别取口正态分布的总体;H1:三组资料并非取自正态分布的总体;«=0.05o②关于方差齐性检验:H。:三纽资料所取自的总体的方差相等;
7、H1:三纽资料所取自的总体的方差不相等或不全相等;«=0.05o【SAS程序】DATAaa;DOg=lTO3;TNPUTX@@;OUTPUT;END;CARDS;2345098513185185624025559183827586316218456534087128432435856591414488494275376298896901PROCSORTDATA二aa;BYg;PROCPRTNT;RUN;二、方差分析数据集的建立技巧1.方差分析的数据集格式统计分析所用的数据格式和我们在分析整理资料时所用的格式是不同的。一般来说,数据
8、集中应至少有一个结果变量,用于记录不同处理因素水平下观察值的大小;至少冇一个处理因素变量,用于记录处理因素的类型及其水平数。以单因素方差分析为例,就应有一个结果变量和一个处理因素变量;而两因索的方差分析应有一个结果变量和两个处理因素变量。例A某职业