欢迎来到天天文库
浏览记录
ID:44774288
大小:419.00 KB
页数:34页
时间:2019-10-28
《协方差分析(Analysis_of_Covariance)》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、协方差分析AnalysisofCovarianceALBERTR.WLDTOLLIAHT报告人:白寅Mslab@TianjinUniv我们先来看一个问题:芬兰由几十个小的自治区组成。在芬兰,白酒的批发和零售是国家垄断的。几个世纪以来,法律规定白酒只能在城市自治区中销售。但是去年这条法律要做修改了,该国的相关部门尝试性地在农村自治区销售白酒,进而研究白酒的销售方式是否会影响当地的交通事故量在去年夏天,他们任选12个农业自治区,在其中4个开设了白酒专卖店;另外4个授权饭店销售白酒;余下的4个保持原来的状态,即禁止销售白酒。开设白酒专卖店授
2、权饭店销售保持禁销白酒12个实验自治区为比较销售白酒对交通事故是否有影响,我们搜集到三组实验区域一年后的交通事故发生数:授权销售白酒类型(要素水平)无授权开设白酒专卖店授权饭店代销交通事故报告数177226226225196229167198215176206188每组平均事故数186.25206.50214.5012地区总平均事故数差异源SSdfMSFP-valueFcrit组间1696.1672848.08332.0793430.1809824.256495组内3670.759407.8611销售白酒对当地的交通事故有影响吗?认为
3、白酒的销售没有影响交通事故率。真的是这样吗?我们用学过的方差分析来比较一下各组均值,他们是:186.25,206.50,214.50F=2.079343<4.256495,接受原假设,即H0:u1=u2=u3实验前后,同一地区的交通事故量应该有某种联系!--回归关系销售白酒后交通事故多的地区有可能是因为其原来交通事故就比其他地区多!是不是有些地区即使不卖白酒交通事故也会比其他地区多?稍加分析我们就会发现,我们的分析有问题直接收集统计资料的有两种方式:实验式和非实验式。如果条件可以完全控制的话(只一个因素变化,其他因素统一)实验式收集数
4、据进行方差分析理论上是可以保证精度的。但是实验条件不能完全控制的时候就要采取统计控制,即用统计的方法排除数据中的干扰因素从而提高精度。——我们知道,就算12个地区白酒的销售方式是随机指定的,由于每组仅仅有四个地区,很难保证三组地区的交通事故只与白酒的销售有关而其他因素统一水平。协方差分析可以解决这类问题。各地的交通事故仅仅与饮酒有关吗?各组数据可比吗?比如人口多的地区,车辆多的地区,雨雪多的地区交通事故就会多协方差分析是如何解决这个问题的呢?第i组第j个观测值随机误差第i组的组效应一般均值方差分析的前提是除随机误差外,水平变量是影响观
5、测值的唯一变量对于芬兰白酒专卖的问题,交通事故显然不是仅仅与销售方式有关,而把其他变量都归为随机误差又太过粗糙.这样。我们就想到了引入其他变量.在协方差分析的模型中,我们称之为协变量.下面我们再看协方差分析数据结构:首先,我们看看方差分析数据结构:“遗传”效应观测值=一般均值+水平影响+协变量影响+随机误差协变量回归系数协变量效应可见,协方差分析将方差分析与回归分析结合了起来.方差分析回归分析从离差分解的角度我们来解释协方差分析对于方差分析:总离差=分组变量离差+随机误差(组内离差)对于协方差分析:总离差=分组变量离差+协变量离差+随
6、机误差在方差分析中,协变量离差包含在了随机误差中.在协方差分析中,单独将其分离出来.于是,我们用协变量对观测值进行修正,去掉“遗传”因素下面的问题是,如何计算回归系数协变量修正后的观测值去除遗传效应总思路在观测值中去除协变量的影响之后,应用方差分析我们把回归系数的计算分为两种情况计算总离差平方和时:我们最终要检验的是分组自变量对因变量有无显著作用.原假设是无显著作用.假设检验以原命题为真为基础进行的.因此,这里我们认为ti=0,即,用回归模型计算回归系数.其最小二乘无偏估计值为由此我们可以计算总离差平方和的修正值:总离差平方和修正值的
7、定义和计算式如下:Y的回归线与回归线的离差平方和回归平方和如果X对Y无作用,b=0,该项则为0为了简化表示,我们定义当计算组内离差平方和时,我们使用组内回归系数 它的计算如下:组内离差平方和的修正值计算如下:在这里我们实际上是假设各组内的回归系数相等(协方差分析基本假设)因而求出了一个统一的组内回归系数.Yi的回归线与回归线的残差平方和组内总离差平方和回归平方和同样为了简化表示,我们定义组内总离差平方和从回归角度看组内残差平方和组内回归平方和接着就要计算组间平方和了。它反映的是各个水平之间的差异有了这三个修正的平方和,我们就可以进行
8、组间无差异的检验了。回头从离差分解的角度我们来解释协方差分析总离差=分组变量离差+协变量离差+随机误差分组变量离差=总离差-协变量离差-随机误差可解释部分不可解释部分我们回头看协方差分析的模型使用该方法进行分析的前提是每
此文档下载收益归作者所有