欢迎来到天天文库
浏览记录
ID:27670898
大小:876.34 KB
页数:81页
时间:2018-12-05
《异方差和自相关1》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第三章异方差和自相关1本章要点异方差的定义、产生原因及后果异方差的检验方法异方差的修正方法自相关的产生原因忽略自相关的严重后果自相关的检验自相关的修正2在前面的章节里我们已经完成了对经典正态线性回归模型的讨论。但在实际中,经典线性回归模型的基本假定经常是不能得到满足的,而若在此状况下仍应用OLS进行回归,就会产生一系列的问题,因此我们就需要采取不同的方法对基本假定不满足的情况予以处理。在本章中,我们将着重考虑假定2和假定3得不到满足,即存在异方差和自相关情况下的处理办法。3第一节异方差的介绍一、异方差的定义及产生原因异方差(het
2、eroscedasticy)就是对同方差假设(assumptionofhomoscedasticity)的违反。经典回归中同方差是指随着样本观察点X的变化,线性模型中随机误差项的方差并不改变,保持为常数,即i=1,2,…,n(3.1)如果的数值对不同的样本观察值各不相同,则称随机误差项具有异方差,即常数i=1,2,…n(3.2)4图3-1异方差直观图5为什么会产生这种异方差性呢?一方面是因为随机误差项包括了测量误差和模型中被省略的一些因素对因变量的影响,另一方面来自不同抽样单元的因变量观察值之间可能差别很大。因此,异方差性多出现在
3、横截面样本之中。至于时间序列,则由于因变量观察值来自不同时期的同一样本单元,通常因变量的不同观察值之间的差别不是很大,所以异方差性一般不明显。6二、异方差的后果一旦随机误差项违反同方差假设,即具有异方差性,如果仍然用OLS进行参数估计,将会产生什么样的后果呢?结论就是,OLS估计量的线性和无偏性都不会受到影响,但不再具备最优性,即在所有线性无偏估计值中我们得出的估计值的方差并非是最小的。所以,当回归模型中随机项具有异方差性时,OLS法已不再适用。7第二节异方差的检验由于异方差的存在会导致OLS估计量的最佳性丧失,降低精确度。所以,
4、对所取得的样本数据(尤其是横截面数据)判断是否存在异方差,是我们在进行正确回归分析之前要考虑的事情。异方差的检验主要有图示法和解析法,下面我们将介绍几种常用的检验方法。8一、图示法图示法是检验异方差的一种直观方法,通常有下列两种思路:(一)因变量y与解释变量x的散点图:若随着x的增加,图中散点分布的区域逐渐变宽或变窄,或出现了偏离带状区域的复杂变化,则随机项可能出现了异方差。(二)残差图。残差图即残差平方(的估计值)与x的散点图,或者在有多个解释变量时可作残差与y的散点图或残差和可能与异方差有关的x的散点图。具体做法:先在同方差的
5、假设下对原模型应用OLS法,求出和残差平方,再绘制残差图(,)。9二、解析法检验异方差的解析方法的共同思想是,由于不同的观察值随机误差项具有不同的方差,因此检验异方差的主要问题是判断随机误差项的方差与解释变量之间的相关性,下列这些方法都是围绕这个思路,通过建立不同的模型和验判标准来检验异方差。10(一)Goldfeld-Quandt检验法Goldfeld-Quandt检验法是由S.M.Goldfeld和R.E.Quandt于1965年提出的。这种检验方法以F检验为基础,适用于大样本情形(n>30),并且要求满足条件:观测值的数目至
6、少是参数的二倍;随机项没有自相关并且服从正态分布。统计假设:零假设:是同方差(i=1,2,…,n)备择假设:具有异方差11Goldfeld-Quandt检验法涉及对两个最小二乘回归直线的计算,一个回归直线采用我们认为随机项方差较小的数据,另一个采用我们认为随机项方差较大的数据。如果各回归直线残差的方差大致相等,则不能拒绝同方差的原假设,但是如果残差的方差增加很多,就可能拒绝原假设。步骤为:12第一步,处理观测值。将某个解释变量的观测值按由小到大的顺序排列,然后将居中的d项观测数据除去,其中d的大小可以选择,比如取样本容量的1/4。
7、再将剩余的(n-d)个数据分为数目相等的二组。13第二步,建立回归方程求残差平方和。拟合两个回归模型,第一个是关于较小x值的那部分数据,第二个是关于较大x值的那部分数据。每一个回归模型都有(n-d)/2个数据以及[(n-d)/2]-2的自由度。d必须足够小以保证有足够的自由度,从而能够对每一个回归模型进行适当的估计。对每一个回归模型,计算残差平方和:记值较小的一组子样本的残差平方和为=,值较大的一组子样本的残差平方和为=。14第三步,建立统计量。用所得出的两个子样本的残差平方和构成F统计量:若零假设为真,则上式中n为样本容量(观测
8、值总数),d为被去掉的观测值数目,k为模型中自变量的个数。15第四步,得出结论。假设随机项服从正态分布(并且不存在序列相关),则统计量/将服从分子自由度和分母自由度均为()的F分布。对于给定的显著性水平,如果统计量的值大于上述F分布的临界值,我们就
此文档下载收益归作者所有