欢迎来到天天文库
浏览记录
ID:52468137
大小:753.50 KB
页数:67页
时间:2020-04-07
《2012-第8章多重共线性.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、多重共线性——解释变量相关会有什么后果?第8章引子:古典假设总是能够满足吗?--------对古典假设的再讨论回顾对模型中随机扰动项和解释变量做的古典假设,有以下几个方面:①回归模型是参数线性的,并且是正确设定的。②随机扰动项与解释变量不相关。③零均值假设:误差项均值为零。④同方差假定:即随机扰动项的方差为一常量⑤无自相关假定:cov(ui,uj)=0,i≠j⑥无多重共线性假定:解释变量之间不存在完全共线性。⑦正态性假定:为了假设检验,假定随项误差u服从均值为零,(同)方差为的正态分布。即,ui~N(0,)引子:古典假设总是能够满足吗?--------对古典假设的再讨论本章
2、试图回答以下问题:(1)多重共线性的性质是什么?(2)多重共线性是否是一个严重的问题?(3)多重共线性的理论后果是什么?(4)多重共线性的实际后果是什么?(5)在实际中,如何发现多重共线性?(6)消除多重共线性的弥补措施有哪些?8.1什么是多重共线性一、多重共线性的概念对于模型Yi=B1+B2X2i+B3X3i++BkXki+ii=1,2,…,n其基本假设之一是解释变量是互相独立的。如果某两个或多个解释变量之间出现了相关性,则称为多重共线性(Multi-collinearity)。8.1什么是多重共线性如果存在c1X2i+c2X3i+…+ckXki=0i=1,2,…,n
3、其中:ci不全为0,则称为解释变量间存在完全共线性(perfectmulticollinearity)。如果存在c1X2i+c2X3i+…+ckXki+vi=0i=1,2,…,n其中ci不全为0,vi为随机误差项,则称为近似共线性(approximatemulticollinearity)或交互相关(intercorrelated)。8.1什么是多重共线性回归模型中解释变量的关系可能表现为三种情形:(1)(2)(3)注意:完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。8.1什么是多重共线性二、产生多重共线性的背景一般地,产生多重共线性的主要原因有
4、以下三个方面:(1)经济变量相关的共同趋势时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。(2)滞后变量的引入8.1什么是多重共线性8.1什么是多重共线性由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。一般经验:时间序列数据样本:简单线性模型,往往存在多重
5、共线性。截面数据样本:问题不那么严重,但多重共线性仍然是存在的。(3)利用截面数据建立模型也可能出现多重共线性(4)样本资料的限制8.2多重共线性产生的后果一、多重共线性的理论后果1.即使是在接近共线性的情形下,普通最小二乘法估计量仍然是无偏的。但要记住的是,无偏性是一个重复抽样的性质。2.接近共线性也并未破坏普通最小二乘估计量的最小方差性:在所有线性无偏估计量中,普通最小二乘法估计量的方差最小。但最小方差并不意味着方差值也较小。3.即使变量X与总体(也即PRF)不线性相关,但却可能与某一样本线性相关。从这个意义上说,多重共线性本质上是一个样本(回归)现象。8.2多重共线性
6、产生的后果二、多重共线性的实际后果1.普通最小二乘法估计量的方差和标准差较大,普通最小二乘法估计量的精确度降低。2.置信区间变宽。由于标准差较大,所以总体参数的置信区间也就变大了。3.t值不显著。4.R2值较高,但t值则并不都显著。8.2多重共线性产生的后果5.普通最小二乘估计量及其标准差对数据的微小变化非常敏感;也就是说,它们趋于不稳定。6.回归系数符号有误。7.难以衡量各个解释变量对回归平方和(ESS)或者R2的贡献。小结:多重共线性的后果1.完全共线性下参数估计量不存在2.近似共线性下OLS估计量非有效8.2多重共线性产生的后果8.2多重共线性产生的后果3.参数估计量
7、经济含义不合理如果模型中两个解释变量具有线性相关性,例如X2=X1,这时,X1和X2前的参数1、2并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。1、2已经失去了应有的经济含义,于是经常表现出似乎反常的现象:例如1本来应该是正的,结果恰是负的。8.2多重共线性产生的后果存在多重共线性时参数估计值的方差与标准差变大容易使通过样本计算的t值小于临界值,误导作出参数为0的推断可能将重要的解释变量排除在模型之外4.变量的显著性检验失去意义8.2多重共线性产生的后果5.模型的预测功能失
此文档下载收益归作者所有