欢迎来到天天文库
浏览记录
ID:7307130
大小:290.12 KB
页数:42页
时间:2018-02-11
《多重共线性问题探讨课件》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、§4.34.34.34.3多重共线性Multi-Collinearity§4.3多重共线性•一、多重共线性的概念•二、实际经济问题中的多重共线性•三、多重共线性的后果•四、多重共线性的检验•五、克服多重共线性的方法•六、案例•*七、分部回归与多重共线性一、多重共线性的概念对于模型Yi=β0+β1X1i+β2X2i+…+βkXki+µii=1,2,…,n其基本假设之一是解释变量是互相独立的。如果某两个或多个解释变量之间出现了相关性,则称为多重共线性(Multicollinearity)。如果存在c1X1i+c2X2
2、i+…+ckXki=0i=1,2,…,n其中:ci不全为0,则称为解释变量间存在完全共线性(perfectmulticollinearity)。如果存在c1X1i+c2X2i+…+ckXki+vi=0i=1,2,…,n其中ci不全为0,vi为随机误差项,则称为近似共线性(approximatemulticollinearity)或交互相关(intercorrelated)。在矩阵表示的线性回归模型Y=Xβ+µ中,完全共线性指:秩(X)3、⋯⋯⎟⎜⎟⎜⎝1XX⋯X⎟⎠1n2nkn中,至少有一列向量可由其他列向量(不包括第一列)线性表出。如:X2=λX1,则X2对Y的作用可由X1代替。注意:完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。二、实际经济问题中的多重共线性一般地,产生多重共线性的主要原因有以下三个方面:(1)经济变量相关的共同趋势时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大4、,小企业都小。(2)滞后变量的引入在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。(3)样本资料的限制样本资料的限制由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。一般经验:时间序列数据样本:简单线性模型,往往存在多重共线性。截面数据样本:问题不那么严重,但多重共线性仍然是存在的。二、多重共线性的后果1、完全共线性下参数估计量不存在Y=Xβ+μ的OLS估计量为:−1βˆ=(X′X)X′Y如果5、存在完全共线性,则(X’X)-1不存在,无法得到参数的估计量。例:对离差形式的二元回归模型y=βx+βx+µ1122如果两个解释变量完全相关,如x2=λx1,则y=(β+λβ)x+µ121这时,只能确定综合参数β1+λβ2的估计值:2、近似共线性下OLS估计量非有效近似共线性下,可以得到OLS参数估计量,但参数估计量方差的表达式为2−1Cov(βˆ)=σ(X′X)由于6、X’X7、≈0,引起(X’X)-1主对角线元素较大,使参数估计值的方差增大,OLS参数估计量非有效。仍以二元线性模型y=β1x1+β2x2+µ为例:8、22222−1σ∑x2iσ/∑x1ivar(βˆ)=σ(X′X)==111222222∑x1i∑x2i−(∑x1ix2i)1−(∑x1ix2i)∑x1i∑x2i2σ1=⋅22∑x1i1−r2(∑x1ix2i)222恰为X1与X2的线性相关系数的平方r∑x1i∑x2i由于r2≤1,故1/(1-r2)≥12var(βˆ)σ2/x2当完全不共线时,r=01=∑1i22σ1σ当近似共线时,02∑x1i1−r∑x1i多重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子(Var9、ianceInflationFactor,VIF)表4.3.1方差膨胀因子表相关系数平方00.50.80.90.950.960.970.980.990.999方差膨胀因子12510202533501001000当完全共线时,r2=1,var(βˆ)=∞13、参数估计量经济含义不合理如果模型中两个解释变量具有线性相关性,例如X2=λX1,这时,X1和X2前的参数β1、β2并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。β1、β2已经失去了应有的经济含义,于是经常表现出似乎反常的现象:例如10、β1本来应该是正的,结果恰是负的。4、变量的显著性检验失去意义存在多重共线性时参数估计值的方差与标准差变大容易使通过样本计算的t值小于临界值,误导作出参数为0的推断可能将重要的解释变量排除在模型之外5、模型的预测功能失效变大的方差容易使区间预测的“区间”变大,使预测失去意义。注意:除非是完全共线性,多重共线性并不意味着任何基本假设的违背;因此,即使出现较高程度的多重共线性
3、⋯⋯⎟⎜⎟⎜⎝1XX⋯X⎟⎠1n2nkn中,至少有一列向量可由其他列向量(不包括第一列)线性表出。如:X2=λX1,则X2对Y的作用可由X1代替。注意:完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。二、实际经济问题中的多重共线性一般地,产生多重共线性的主要原因有以下三个方面:(1)经济变量相关的共同趋势时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大
4、,小企业都小。(2)滞后变量的引入在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。(3)样本资料的限制样本资料的限制由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。一般经验:时间序列数据样本:简单线性模型,往往存在多重共线性。截面数据样本:问题不那么严重,但多重共线性仍然是存在的。二、多重共线性的后果1、完全共线性下参数估计量不存在Y=Xβ+μ的OLS估计量为:−1βˆ=(X′X)X′Y如果
5、存在完全共线性,则(X’X)-1不存在,无法得到参数的估计量。例:对离差形式的二元回归模型y=βx+βx+µ1122如果两个解释变量完全相关,如x2=λx1,则y=(β+λβ)x+µ121这时,只能确定综合参数β1+λβ2的估计值:2、近似共线性下OLS估计量非有效近似共线性下,可以得到OLS参数估计量,但参数估计量方差的表达式为2−1Cov(βˆ)=σ(X′X)由于
6、X’X
7、≈0,引起(X’X)-1主对角线元素较大,使参数估计值的方差增大,OLS参数估计量非有效。仍以二元线性模型y=β1x1+β2x2+µ为例:
8、22222−1σ∑x2iσ/∑x1ivar(βˆ)=σ(X′X)==111222222∑x1i∑x2i−(∑x1ix2i)1−(∑x1ix2i)∑x1i∑x2i2σ1=⋅22∑x1i1−r2(∑x1ix2i)222恰为X1与X2的线性相关系数的平方r∑x1i∑x2i由于r2≤1,故1/(1-r2)≥12var(βˆ)σ2/x2当完全不共线时,r=01=∑1i22σ1σ当近似共线时,02∑x1i1−r∑x1i多重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子(Var
9、ianceInflationFactor,VIF)表4.3.1方差膨胀因子表相关系数平方00.50.80.90.950.960.970.980.990.999方差膨胀因子12510202533501001000当完全共线时,r2=1,var(βˆ)=∞13、参数估计量经济含义不合理如果模型中两个解释变量具有线性相关性,例如X2=λX1,这时,X1和X2前的参数β1、β2并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。β1、β2已经失去了应有的经济含义,于是经常表现出似乎反常的现象:例如
10、β1本来应该是正的,结果恰是负的。4、变量的显著性检验失去意义存在多重共线性时参数估计值的方差与标准差变大容易使通过样本计算的t值小于临界值,误导作出参数为0的推断可能将重要的解释变量排除在模型之外5、模型的预测功能失效变大的方差容易使区间预测的“区间”变大,使预测失去意义。注意:除非是完全共线性,多重共线性并不意味着任何基本假设的违背;因此,即使出现较高程度的多重共线性
此文档下载收益归作者所有