回归诊断(14年)

回归诊断(14年)

ID:37832731

大小:265.23 KB

页数:59页

时间:2019-06-01

回归诊断(14年)_第1页
回归诊断(14年)_第2页
回归诊断(14年)_第3页
回归诊断(14年)_第4页
回归诊断(14年)_第5页
资源描述:

《回归诊断(14年)》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、回归诊断在前面讨论多元线性回归问题中,我们作了如下一些假定:回归函数的线性假设:E(Y)是x,,xx的线性函数;12p误差方差的独立性假设:随机误差,,相互独立。12n2误差方差的齐性假设:EV0,ar;ii误差的正态性假设:,,服从正态分布。12n•在实际中这些假定是否合理?如果实际数据与这些假设偏离比较大,那么前面讨论的有关参数的区间估计,假设检验就不再成立。如果经过分析,已经确认对所研究的具体数据,上面的假设不成立,那么我们又希望探讨对数据作怎样的修正后,能使它们满足或近似满足这些假设。这些就是回归诊断中所

2、要解决的第一个问题。•回归诊断的另一个研究的问题是对数据的诊断,探查对统计推断有较大影响的试验点,这样的点称为强影响点。1残差及残差图由前面的讨论可知:2EeVˆˆ0,ar()e(IH)CovYe(,)0ˆˆ22当~N,0(I)时,eNˆ~(0,(IH))n我们可以看出普通残差与H之间有着密切的关系,为此进一步讨论H(h)的性质如下:ij定理3.1(1)01h,且h1时,h,0ji。iiiiijn(2)hpii1,其中p为自变量个数。i12证明:(1)因为HH,HH,所以有n2222hhiii

3、jhhhiiijij0jj1iji2故有:hh,由此可得。iiiin11(2)htiirIHt()(rXX())(XXtrX())1XXXpi1一般情况下:1'1hx()()xLxx,iiiin21()xxi对一元线性回归方程来说:h.iinlxx一般来讲,eeˆˆ,,,eˆ是相关的,且它们的方差不等。所以不宜直接用eˆ12ni作比较来判别异常点。引进学生化残差称:eˆiri(1,2,,)ni1hsii为学生化残差(或标准化残差),其中:h为H矩阵的第i个对角元,iiSSEs

4、。np1一般说来,r的确切分布由于eˆ与s是不独立的所以很ii难求得,但在模型假设成立时,r,r,,r近似独立,且近12n似服从N)1,0(,可以近似认为r,r,,r是来自N)1,0(的12n随机子样(r的分布可见陈希孺、王松桂《近代回归分析》,i1987)。依据标准化残差r,r,,r近似服从N(0,1)近似相12n互独立这一结论,常用残差图对模型假设的合理性进行检验。残差图是一种直观的工具,它是以学生化残差r为纵坐标,以任何其它的量为横坐标的散点图。常用的横坐标有如下三种:以拟合值yˆ为横坐标;以xin1,2,,为横坐标;i一般

5、残差图均要求n个点的散布是无规则的(若是标准化残差,则还要求n个点大致落在

6、

7、2r的水平带内)。当残差图中的点呈现某种规律或趋向时,就可以对模型的假设提出怀疑。利用残差图上点的散布规律作诊断的方法是回归分析中对模型的诊断的最有效的方法之一。残差图ee00xx(a)(b)ee1357002468xx(c)(d)统计诊断的内容和意义•我们所选择的模型能不能大体上反映所要研究的实际问题?•我们收集的数据会不会由于收集过程中的疏忽或其它种种原因而出现较大的误差?这些错误数据会不会严重干扰我们对实际问题所作的结论?统计诊断是针对上述问题发展起来的一种分析方

8、法。寻找一种诊断方法,判断实际数据与既定模型是否有较大偏离,并采取相应的对策是统计诊断的主要内容。综合以上所述回归诊断有如下主要内容:•识别、判定和检验异常点。•区分出对统计推断影响特别大的点(影响分析)。•残差分析和残差图能用于研究既定模型与实际数据是否能很好拟合。其中包括:模型线性诊断、模型误差方差齐性诊断、模型误差独立性诊断、模型误差正态性诊断等。2回归诊断一(模型的诊断)一、回归函数线性的诊断(1)模型诊断诊断回归函数是否是xx,,x的线性函数的主要工具12p是以拟合值yˆ为横坐标的残差图。p=1时可用散点图。Ixyyˆeˆ1800.61

9、.6625-1.062522206.77.75-1.0531405.34.271431.02857412043.401790.5982151806.556.010710.5392961002.152.53214-0.3821472006.66.88036-0.2803681605.755.141070.60893由上述数据,可得y关于x的一元线性回归方程yˆ.182.00435x回归方程所对应的的估计值及相关系数分别为:s.0869r.0935其拟合值及残差见上表。其散点图(a)及残差图(b)如下从散点图可以看出,x与y之间的关系用线

10、性函数去描述不太适合,最好看成是x的二次函数;从残差图发现,点的散布是有规律的,对就yˆ小的及yˆ大的残差为负,而yˆ介

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。