资源描述:
《残差分析在回归模型诊断中的应用_梁跃武》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、中国卫生统计年第卷第斯·实例分析·残差分析在回归模型诊断中的应用同济医科大学环境医学统计教研室梁跃武林琼芳宋瑞砚因变量,e;i二e;+人们在用最小二乘法研究线性回归模型y的关系人们引进了偏残差,a`i。,。月习和回归系数月为尽iX+时为了使常数项此外还有学生化残差等,,,无偏估计且具有方差最小性而要求随机误以某种残差为纵坐标其它变量为横坐标。。)二。uass一arkov,〔忿’。差满足E(和GM假定作散点图即残差图它是残差分析的重要COV(。二。“,。:)I并在探讨其假设检验和区间方法之一通常横坐标的选择有三种(1)因,。,即。~N,,,=1,估计时假设了服从正态分布(O变量的拟合值Y(
2、2)自变量X(j’2aZ〔`’。,,;I)的重要条件换句话说只有在随机…P)(3)当因变量的观侧值为一时间序列,,。误差满足方差齐性和正态分布和情况下才能时横坐标可取观测时间或观测序号根据残。因,得到精度较高自如和月的估计此当取得一差图的分布趋势可以帮助判明所拟合的线性模,,。e`组实测数据时这组数据是否符合上述假设型是否满足有关假设如残差是否近似正态。,,就成为一个重要的间题人们曾试图用确定系分布是否方差齐变量间是否有其它非线性。、F检验或数(或相关系数)t检验等方法来检关系及是否还有重要自变量未进入模型等,,验这一间题但理论和实践表明上述检验结果当判明有某种假设条件欠缺时进一步的。,
3、..。,并不理想为此从60年代起FJAsncombe问题就是加以校正或补救需分析具体情况。.,,,和JWTukey等学者作了许多工作建立了探素合适的校正方案如非线性处理引入新。,。`“’以残差分析为基础的一些方法70年代以自变量或考察误差是否有自相关性等,,来随着计算机的普及残差分析得到了迅速,。实例分析发展而被认为是回归间题的一个组成部分1:1本文拟结合实例讨论残差分析在回归模型诊断例起初仅将表中某病可疑病因学因:、:、3,素XXX与发病水平Y引入线性回归中的一些应用问题即当用一组数据建立回归,模型时如何考察它是否满足模型所要求的假裹1某病病因学因素Xi及发病水平Y。设条件及如何加以校
4、正和补救::3一XXXXY`丹口占人6JO,八U。曰吮丹勺1.,J0ùó二ó了,孟人门了OU,ó。血口ù丹ù工口OJ。。65242422064nU0o020no735勺口25261O6O..残差分析。。。3O15074。。古孟二人.1,。“”,O8O……1043所谓残差即因变量的实际观测值与其。O8。087。6,。*二`一`=,,,。。回归估计值的差YY“12…60日69。。9O1092。,)n如果回归模型正确的话我们可以将残差17。O102。7e`。勺曰ù碗b`工了ùtn。`孟人孟.,ùó甘ón。看作误差e`的观测值它应符合模型的假设匕s448622O20n0o725。18。0:931
5、,e`。条件且具有误差的一些性状利用残差所。人几j.,。402…1159。提供的信息来考察模型假设的合理性及数据的23。0838。9一O1133。可靠性称为残差分析。109。480,上述e`=Y;一Y`残差有多种形式为普。,通残差为了更深入地研究某自变量X与同济医科大学环境毒理教研室50,,,,模型得到回归方程看出散点分布呈弧状趋势据一般规律可`吕’。`二.。.:一1.s能有重要自变量遗漏当增加自变量XY16924一0505X一1299X153X,.后霞新建立回归模型入。,犷。。I.:对该模型进行残差分析以y为横坐标=8071+0342X一0130Xe`一。.:.,普通残差为纵坐标作残差
6、图(图1a)从中一0331X+1335X口宕25`....一25.二…(ya()二(b)日1普通残差图,b所示,:这时残差图如图卜散点分布较表2某地诸因素与大气中NO含量,“”,。为均匀说明诊断较恰当校正效果较好,汽车流址气温风速NO、、2:2例表系某地汽车流量气温风速X以俪/小时)X:(℃)X3(米)Y(毫克/米)/秒:,与大气中NO含量的测定结果据此建立线性130020。00。460。0661444。。0。076230050模型:26。51。50O。001786..Y=一012+0000iXx+165223。OO。40O。170。。。.。1756295O90O1560005X:一00
7、38Xs。。。1754300O800120120022。51。800。040以期对该地的大气污染情况进行预侧。试。。。1500218O600120。,e,。。以自变量X为横坐标残差为纵坐标作残差120027。D1700100`。。一。,。1476270O65O129图(图2)对此模型进行诊断图中散点呈。182022。OO40O一135,。漏斗状分布可能系自变量X的非线性影响143628。O忍。000。09994822。52一000。