资源描述:
《第12章单因素方差分析.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、个人收集整理勿做商业用途 第12章 方差分析(AnalysisofVariance)方差分析是鉴别各因素效应的一种有效统计方法,它是通过实验观察某一种或多种因素的变化对实验结果是否带来显著影响,从而选取最优方案的一种统计方法。在科学实验和生产实践中,影响一件事物的因素往往很多,每一个因素的改变都有可能影响产品产量和质量特征。有的影响大些,有的影响小些。为了使生产过程稳定,保证优质高产,就有必要找出对产品质量有显著影响的那些因素及因素所处等级。方差分析就是处理这类问题,从中找出最佳方案。方差分析开始于本世纪20年代。19
2、23年英国统计学家R.A.Fisher 首先提出这个概念,(ANOVA)。因当时他在Rothamsted农业实验场工作,所以首先把方差分析应用于农业实验上,通过分析提高农作物产量的主要因素。Fisher1926年在澳大利亚去世。现在方差分析方法已广泛应用于科学实验,医学,化工,管理学等各个领域,范围广阔。在方差分析中,把可控制的条件称为“因素”(factor),把因素变化的各个等级称为“水平”或“处理”(treatment)。若是试验中只有一个可控因素在变化,其它可控因素不变,称之为单因素试验,否则是多因素试验。下面分
3、别介绍单因素和双因素试验结果的方差分析。1.1单因素方差分析(OneWayAnalysisof Variance)1. 一般表达形式2. 方差分析的假定前提3.数学模形4.统计假设5.方差分析:(1)总平方和的分解;(2)自由度分解;(3)F检验6.举例 7.多重比较1.1.1一般表达形式首先通过一个例子引出单因素方差分析方法。某农业科研所新培养了四种水稻品种,分别用A1,A2,A3,A4表示。每个品种随机选种在四块试验田中,共16块试验田。除水稻品种之外,尽量保持其它条件相同(如面积,水分,日照,肥量等),收获后计算
4、各试验田中产量如下表: 试验批号 产量(公斤)1234品种A11820191718.5A22221242021.75A32527262826.5A42928242526.5 通过这些数据要考察四个不同品种的单位产量,是否有显著性差异。类似的例子很多,如劳动生产率差异,汽车燃油消耗,金属材料淬火温度等问题。上述问题可控实验条件是“种子”。所以种子是因素。把不同的品种A1,A2,A3,A4称为“水平”个人收集整理勿做商业用途。1,2,3,4表示试验批号,即每次随机的选取某个地块种某个品种的种子。称此种问题为单因素试验。
5、单因素试验通常分多个试验批号,目的是平衡一些不可控因素带来的影响。如土地的基本条件不一样。如各品种只试验一次,必然在试验结果中含有不可控因素带来的影响。在众多的数据中,怎样判别不同品种的水稻产量是否存在显著性差异?初步观察A1品种的产量可能低一些,A3,A4的产量可能高一些。这是从平均数上观察。若按前面介绍的两个总体的比较,需要作C24=6次检验。比较麻烦,所以需要方差分析方法。首先从数学上给出这类问题的一般形式(单因素) 批号 验结果i…j…m行平均均值水平A1X11…X1j…X1 m1.m1………AiXi1…Xi
6、j…Ximi.mi…………AkXk1…Xkj…Xkmkmk= (km = N)m这表明该可控因素共有k个水平,每个水平都进行m次试验,某个水平上的m次试验可当作一个样本看待。Xij表示第i个水平上第j次试验的结果。很容易看出当水平只有2个时,这相当于两个总体的均值的显著性检验问题。现在的目的是要分析各个水平上的均值是否有显著性差异。1.1.2 方差分析的假定前题(1)每个水平(Ai)上的随机变量Xi的分布都是正态的,即服从N(mi,s2)。但mi,(i=1,…,m),s2未知。每个水平
7、上的一系列观测值,看作是取自该水平正态总体的一个容量为m的样本。 (2)认为k个水平上的k个总体方差相等,都是s2(方差齐性)。 (3)观测值Xij相互独立。这三个假定在实际中一般都能得到满足。1.1.3 数学模型因为Xij~N(mi,s2),(i=1,…,k)所以可以把观测值Xij分解为两部分,即 Xij= mi+eij,(i= 1,…,k),(j=1,2,…,m)其中eij表示Xij对mi的随机偏差。为便于比较水平不同对Xij造成的影响,可以把mi也分解成两部分mi=m+ai (i=1,…,k)其中m =,称为总
8、平均(Grand mean),ai称为Ai水平上的效应,它满足Sai=0个人收集整理勿做商业用途把mi代入上式则有:Xij= m+ai+eij, Sai=0, (i=1,2,…,k),(j=1,2, …,m)eij表示随机变量,ai表示水平变量。这就是单因素方差分析的数学模型。1.1.4统计假设:若可控因素的不同水平对试验结果无显