欢迎来到天天文库
浏览记录
ID:43739633
大小:451.00 KB
页数:41页
时间:2019-10-13
《第7章 多重共线性》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第7章多重共线性本章教学要求:(1)理解多重共线性的含义和表现。(2)理解多重共线性存在的后果。(3)掌握检验多重共线性的方法。(4)掌握多重共线性的解决方法。对于模型Yt=b0+b1X1t+b2X2t++bkXkt+t(t=1,2,…,n)其基本假设之一是解释变量之间不存在多重共线性。7.1多重共线性的概念及产生原因7.1.1多重共线性的概念在矩阵表示的线性回归模型Y=XB+U中,完全共线性指:如果存在一组不全为零的数则称为解释变量间存在完全共线性(perfectmulticollinearity)。rank(X)2、1即,解释变量的观测值矩阵至少有一列向量可由其他列向量线性表出。完全共线性的含义:t=1,2,…,nut为随机误差项,则称为解释变量间存在不完全共线性或近似共线性(approximatemulticollinearity)。不完全共线性的含义:如果存在一组不全为零的数X2X3X3*1050491575781890902412012530150153完全和不完全多重共线性的数值举例:注意:完全共线性和完全无多重共线性的情况并不多见,一般出现的是不完全共线性。因此,我们关心的不是有无多重共线性,而是多重共线性的程度。一般地,产生多3、重共线性的主要原因有以下几个方面:(1)经济变量相关的共同趋势时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。7.1.2多重共线性产生的原因(2)滞后变量的引入在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。(3)解释变量选择不当无法求出参数的最小二乘估计量逆阵不存在OLS估计量完全共线性74、.2多重共线性造成的影响完全共线性下参数估计量不存在不完全共线性下的OLS估计量:不完全共线性下,仍满足经典假定,得到的OLS参数估计量可求,且仍是BLUE。但由于近似共线性,5、X’X6、0,仍可造成一定的后果。7.2.1参数估计值很不稳定,并且对样本非常敏感严重多重共线性导致难以识别多重共线性变量的各自影响,OLS估计量对观测值的轻微变化相当敏感。YX2X312420234124605816Y,X2和X3的人为数据=1.1939+0.4463x2t+0.0030x3t(1.5431)(2.4151)(0.0358)R2=0.7、8101r23=0.5523YX2X312420234046125816=1.2108+0.4014x2t+0.0270x3t(1.6187)(1.4752)(0.2158)R2=0.8143r23=0.8285但由于近似共线性,8、X’X9、0,引起(X’X)-1各元素较大,但参数估计量方差的表达式为:7.2.2增大最小二乘估计量的方差使参数估计值的方差增大,估计值的精度降低。可以证明,参数估计值的方差为:其中,是第i个解释变量对模型中的其它解释变量作辅助回归模型时的决定系数。称为方差膨胀因子(VarianceInflatin10、gFactor,VIFi)存在多重共线性时参数估计值的方差与标准差变大容易使通过样本计算的t值小于临界值,误导作出参数为0的推断可能将重要的解释变量排除在模型之外7.2.3影响显著性检验的可靠性,导致弃真错误7.2.4参数的置信区间明显增大。多重共线性检验的任务是:(1)检验多重共线性的程度;(2)估计多重共线性的形式,即判断哪些变量之间存在共线性。多重共线性表现为解释变量之间具有相关关系,所以用于多重共线性的检验方法主要是统计方法:如判定系数检验法、逐步回归检验法等。7.3多重共线性的检验(1)若在OLS法下:R2与F值较大11、,但t检验值较小:7.3.1根据回归结果判断回归结果具有以下特征时,模型很可能存在多重共线性:(3)对模型增添一个新自变量后,模型中原有参数估计值的方差明显增大;或当一个不太重要的解释变量被删除后,回归结果显著变化。说明各解释变量对Y的联合线性作用显著,但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨,故t检验不显著。(2)从经济理论知某个自变量对因变量有重要影响,但其系数的OLS估计量不显著或系数估计值的符号不正确。7.3.2辅助回归模型检验法使模型中每一个解释变量分别以其余解释变量为解释变量进行回归,并计算相应的拟12、合优度。如果某一种回归:Xji=1X1i+2X2i+kXki的判定系数较大,F统计量明显超过临界值,说明Xj与其他X间存在高度共线性。克莱因经验法则:仅当来自一个辅助回归的R2大于得自Y对全部回归元的回归中的总R2值时,多重共线性才会产生严重问题。7.3.3利用缺某一
2、1即,解释变量的观测值矩阵至少有一列向量可由其他列向量线性表出。完全共线性的含义:t=1,2,…,nut为随机误差项,则称为解释变量间存在不完全共线性或近似共线性(approximatemulticollinearity)。不完全共线性的含义:如果存在一组不全为零的数X2X3X3*1050491575781890902412012530150153完全和不完全多重共线性的数值举例:注意:完全共线性和完全无多重共线性的情况并不多见,一般出现的是不完全共线性。因此,我们关心的不是有无多重共线性,而是多重共线性的程度。一般地,产生多
3、重共线性的主要原因有以下几个方面:(1)经济变量相关的共同趋势时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。7.1.2多重共线性产生的原因(2)滞后变量的引入在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。(3)解释变量选择不当无法求出参数的最小二乘估计量逆阵不存在OLS估计量完全共线性7
4、.2多重共线性造成的影响完全共线性下参数估计量不存在不完全共线性下的OLS估计量:不完全共线性下,仍满足经典假定,得到的OLS参数估计量可求,且仍是BLUE。但由于近似共线性,
5、X’X
6、0,仍可造成一定的后果。7.2.1参数估计值很不稳定,并且对样本非常敏感严重多重共线性导致难以识别多重共线性变量的各自影响,OLS估计量对观测值的轻微变化相当敏感。YX2X312420234124605816Y,X2和X3的人为数据=1.1939+0.4463x2t+0.0030x3t(1.5431)(2.4151)(0.0358)R2=0.
7、8101r23=0.5523YX2X312420234046125816=1.2108+0.4014x2t+0.0270x3t(1.6187)(1.4752)(0.2158)R2=0.8143r23=0.8285但由于近似共线性,
8、X’X
9、0,引起(X’X)-1各元素较大,但参数估计量方差的表达式为:7.2.2增大最小二乘估计量的方差使参数估计值的方差增大,估计值的精度降低。可以证明,参数估计值的方差为:其中,是第i个解释变量对模型中的其它解释变量作辅助回归模型时的决定系数。称为方差膨胀因子(VarianceInflatin
10、gFactor,VIFi)存在多重共线性时参数估计值的方差与标准差变大容易使通过样本计算的t值小于临界值,误导作出参数为0的推断可能将重要的解释变量排除在模型之外7.2.3影响显著性检验的可靠性,导致弃真错误7.2.4参数的置信区间明显增大。多重共线性检验的任务是:(1)检验多重共线性的程度;(2)估计多重共线性的形式,即判断哪些变量之间存在共线性。多重共线性表现为解释变量之间具有相关关系,所以用于多重共线性的检验方法主要是统计方法:如判定系数检验法、逐步回归检验法等。7.3多重共线性的检验(1)若在OLS法下:R2与F值较大
11、,但t检验值较小:7.3.1根据回归结果判断回归结果具有以下特征时,模型很可能存在多重共线性:(3)对模型增添一个新自变量后,模型中原有参数估计值的方差明显增大;或当一个不太重要的解释变量被删除后,回归结果显著变化。说明各解释变量对Y的联合线性作用显著,但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨,故t检验不显著。(2)从经济理论知某个自变量对因变量有重要影响,但其系数的OLS估计量不显著或系数估计值的符号不正确。7.3.2辅助回归模型检验法使模型中每一个解释变量分别以其余解释变量为解释变量进行回归,并计算相应的拟
12、合优度。如果某一种回归:Xji=1X1i+2X2i+kXki的判定系数较大,F统计量明显超过临界值,说明Xj与其他X间存在高度共线性。克莱因经验法则:仅当来自一个辅助回归的R2大于得自Y对全部回归元的回归中的总R2值时,多重共线性才会产生严重问题。7.3.3利用缺某一
此文档下载收益归作者所有