第五章 异方差与异常值问题

第五章 异方差与异常值问题

ID:20356936

大小:1.93 MB

页数:35页

时间:2018-10-12

第五章  异方差与异常值问题_第1页
第五章  异方差与异常值问题_第2页
第五章  异方差与异常值问题_第3页
第五章  异方差与异常值问题_第4页
第五章  异方差与异常值问题_第5页
资源描述:

《第五章 异方差与异常值问题》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第五章异方差与异常值问题学习目标学习本章后,您应该做到:1.了解异方差性的含义及产生的原因;2.理解出现异方差性时使用OLS的后果;3.了解异方差检验基本思路及各检验方法的假设条件;熟练掌握Goldfeld-Qunandt检验、Glejser检验、White检验以及Breusch-Pagan检验;4.了解修正异方差性的主要方法,掌握加权最小二乘法;5.理解怀特异方差--稳健估计量(RobustEstimators)及其应用;6.掌握EViews软件的基本操作方法。学习重点与难点理解出现异方差性时使用OLS的后果;理解怀特异方差--稳健估计量(Ro

2、bustEstimators)及其应用;重点是理解异方差检验基本思路及各检验方法的假设条件与检验步骤,掌握修正异方差性的主要方法。难点是EViews软件的应用操作方法。经典线性回归模型的一个很重要的假定是随机项的同方差性,即对于每个,的条件方差都是同一个常数。本章中,我们分析这一假定的真实性,并探讨如果此假定不成立将会出现什么后果,以及异方差性的检验与补救措施等问题。第一节异方差问题及其对建模的影响一、异方差及其产生的原因若对于给定解释变量的值为条件的随机项的方差不再是一个常数,而是取得不同的数值,即≠常数1,2,…,5.1则称随机项具有异方差性

3、(Heteroscedasticity)。如果被解释变量观测值的分散程度是随解释变量的变化而变化的,如图5.1所示,可以把异方差看成是由于某个解释变量的变化而引起的,则图5.1异方差示意图由于经济现象是错综复杂的,所以同方差性的假定往往不符合实际情况,而异方差是大量存在的。例如,考虑家庭的可支配收入和储蓄的关系,如建立如下家庭收入-储蓄模型5.2其中,为第个家庭的储蓄,为第个家庭的收入。从二者的关系不难看出,当收入增加时,平均储蓄也会随之增加。如果我们对不同收入水平家庭的储蓄进行观察,同样也会发现,低收入的家庭储蓄差异性较小,而高收入的家庭储蓄的

4、差异性较大。这是因为低收入的家庭,其收入中扣除必要的生活支出以外,用于其他支出和储蓄的部分也较少,因此随机项波动的程度小,即方差小;而高收入家庭,其收入中扣除必要的生活支出以外,剩余的就较多,就有更大的使用选择余地,因而随机项波动的程度就大,这样储蓄的差异就较大,即方差大。因此,对于家庭收入-储蓄模型,随机项具有异方差性。可用图5.2表示。yx图5.2收入-储蓄模型中的异方差可以看出,储蓄的离散程度随收入的增加而增大,具有明显的异方差性。再如,利用工业企业的截面数据估计生产函数5.3其中,为劳动力,为资本,为产出,为随机项,在该问题中表示了包括不

5、同企业在设计上、生产工艺上的区别,技术熟练程度和管理上的差别以及其它因素。这些因素在小企业之间差别不大,而在大企业之间,这些因素都相差甚远,即随机项的方差随着解释变量的增大而增大。产生异方差的原因主要来自以下几个方面:1.模型中省略的解释变量。例如,模型本来应当为,假如被略去了,而采用了模型当被略去的与有呈同方向或反方向变化的趋势时,随的有规律变化会体现在上式的中。如果将某些未在模型中出现的重要影响因素归入随机误差项,而且这些影响因素的变化具有差异性,则会对被解释变量产生不同的影响,从而导致误差项的方差随之变化,即产生异方差性。注意模型设定偏误(

6、以后将介绍)。往往从表象看像是异方差问题,其实是由于模型中的一些重要变量被忽略了。例如,在一个对商品的需求函数中,如果没有把有关的互补品和(或)替代品价格包括进来(遗漏变量偏误),则回归残差可能给人以异方差的表面印象;而当模型把所忽略的变量包括进来时,这种现象也许会消失。2.测量误差。一方面,由于解释变量取值越大,测量误差就会趋于增大;另一方面,测量误差又有可能随时间而变化,比如测量技术、抽样技术和数据采集技术等的不断改进,测量误差有可能减少。例如,有成熟的数据处理设备的银行,在为客户提供的月度或季度报表中,相对于没有这种设备的银行,会出现更少的

7、差错。3.异方差性的另一来源是模型中一个或多个回归元的分布偏态(skew-ness),即截面数据中总体各单位的差异。诸如收入、财富和教育等经济变量都是很好的例子。例如前面所举的家庭收入-储蓄模型,如果采用不同家庭收入组的数据,低收入组的家庭储蓄的差异较小,高收入的家庭储蓄差异较大,最终反映为随机项偏离其均值的程度有变化而出现异方差。异方差性在截面数据中比在时间数列中可能更常出现,这是因为同一时点不同对象的差异,一般说来会大于同一对象不同时间的差异。4.模型函数形式设定错误。如把变量间本来为非线性的关系设定为线性,也可能导致异方差。5.异方差性还会

8、因为异常观测(outliers)的出现而产生。一个超越正常范围的观测值称为异常观测,是指和其他观测值相比相差很多(非常小或非常大)的观测

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。