资源描述:
《第章方差分析(精品)》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、第5章方差分析方差分析是统计学的一个重要范畴,是对观察结果的数据作分析的一•种常用的统计方法,n的是检验两个或多个样本均数间差杲的显著性意义。这种命名是因为在检验均数间差杲是否具有统计学意义的过程中,我们实际上是通过比较方差而得到结果的。方差分析主要用于均数差别的显著性检验、分离各有关因素并估计其对总变异的作用、分析因素间的交互作用和方差齐性检验。方差分析具冇广泛的用途,例如医学界研究几种药物对某种疾病的疗效可以川方差分析方法去解决。方差分析的概念在科学实验中常常耍探讨不同实验条件或处理方法对实验结果的影响。通常是比较不同实验条件下样木均值间差界。方差
2、分析是检验两个或多个样本均数间差异是否具有统计意义的一种方法。1.方差分析原理方差分析的基本原理是认为不同处理组的均数间的差别基本来源冇两个:(1)随机谋差,例如测最谋差造成的差异,称为组内差异。用变最在各组的均值与该组内变量值之偏(离均)差平方和的总和表示。记作SS爼内。(2)实验条件,即不同的处理造成的差杲,称为组间差界。用变量在各组的均值与总均值之偏(离均)爰平方和的总和表示。记作SS组间。SS纽间、SS纽内除以各自的自由度得到其均方值即组间均方和组内均方。一种情况是处理没有作用,即各样木均来印司一总体。MSrn/MS^=1o考虑抽样误差的存在,
3、则有MS纽何/MS组内〜1。另一种情况是处理因素确实有作用。组间均方是由于误差与不同处理共同导致的结果,即各样木来自不同总体。那么,纟R间均方会远远人于纟fl内均方。MSm>>MSMS纽间/MS组内比值构成F分布。用F值与其临界值比较,推断各样本是否来自相同的总体。2.方差分析的假设检验假设有m个样本,如果原假设Ho:样本均数都相同Ui=U2=U3==Um=U,m个样本有共同的方差。餐则m个样本來自具有共同的方差。$和相同的均数p的总体。如果经过计算结果组间均方远远大于组内均方的F>F讣仙间」组内〉,(括号中的两个f是自由度)则P<0.05,推翻原假设
4、,说明样本來白不同的正态总体,说明处理造成均值的差异,有统计意义。否则,FVFom组间"内〉,P>o.05承认原假设,样本来自相同总体,处理无作用。方差分析中的术语方差分析中常用的术语冇以下儿个:1.因素与处理因素是影响因变量变化的客观条件;处理是影响因变量变化的人为条件。也可以通称为因素。例如彫响农作物产量的因素有气温、降雨量、日照时间等;研究不同肥料对不同种系农作物产量的影响时农作物的不同种系可称为因素,所施肥料可视为不同的处理。一般情况下Factors与Treatments在方差分析中可作相同理解。在要求进行方差分析的数据文件中均作为分类变量出现
5、。即它们的值只有有限个取值。即使是气温、降雨量等平常看作是连续变量的,在方差分析中如果作为影响产量的因素进行研究,就应该将其数值用分组定义水平的方法事先变为具有有限个取值的离散变量。2.水平因素的不同等级称作水平。例如,性别因素在一般情况下只研究两个水平:男、女。化学实验或牛物实验中的“剂量”必须离散化为儿个有限的水平数。如:Ind、2ml、4m1三个水平。应该特别注意的是在SPSS数据文件中,作为因素出现的变量不能是字符型变量,必须是数值型变虽。例如性别变fiSEX,定义为数值型,取值为0、L换句话说,因索变量的值实际上是该变最实际值的代码,代码必须
6、是数值型的。可以定义值标签F、M(或Female,male)來表明0、1两个值的实际含义,以便在打印方差分析结果时使用。使结果更加具有可读性。3单元(Cell)在方差分析屮Cell指各因素的水平之间的每个纟R合。例如研究问题屮的因素有性别Sex,取值为1、2;冇年龄,分三个水平1(10岁)、2(11岁)、3(12岁)。两个变屋的组合共可形成六个单元:[1,1]、[],2]、[1,3]、[2,1]、[2,2]、[2,3],代表两种性别与三种年龄的六种组合。4.因素的主效应和因素间的交互效应这是在科学实验屮常常遇到的问题。举例说明之:有A、B两种药物治疗缺
7、铁性贫血,患者12例,分为4组。实验方案是:第一组用一般疗法;第二组在一般疗法基础上加用A药;第三组在一般疗法基础上加用B药,第四组在一-般疗法基础上A、B两药同时便用。一个月后观察红细胞增加数°要求分析两种药物的疗效(数据见表12-l)o数据來源于《医用统计方法》(金丕焕,人民卫生出版社)。表12—1实验数据(红细胞增加数百万/m‘)笫•组第二组第三组第四组0.81.30.92.10.91.21.12.20.71.11.02.0各组平均值0.81.21.02.1这是个双因索方差分析的问题,因索A与因索B。每个因索均有卅该药与不用该药两个水平,研究药物
8、A和B是否对红细胞的增加有显著影响是对红细胞增加数的均值作以下比较:(1)比较第二组的均值与第