欢迎来到天天文库
浏览记录
ID:43364887
大小:698.68 KB
页数:11页
时间:2019-09-29
《多重共线性-例题》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、2.多重共线性的经济解释(1)经济变量在时间上有共同变化的趋势。如在经济上升时期,收入、消费、就业率等都增长,当经济收缩期,收入、消费、就业率等又都下降。当这些变量同吋进入模型后就会带來多重共线性问题。(2)解释变量与其滞后变量同作解释变量0・0E4500DE411⑪4.E+11GDP3.E+11■•••、・••・■・•2.E+11-•••••■・・・•°・二.1.E+11•n■••//O.E-kOO一GDP(-1)0.E+001.E+112.E+113.E+114.E+13.多重共线性的后果(1)当丨皿/丨二1,X为降秩矩阵,则(X'X)'1不存在,p=
2、(X'X)~xX丫不可计算。(2)若即使ImnlTl,鸟仍具有无偏性。E(^)=E[(Xg'X'Y]=E[(X'X)-]XX/3+w)]二戸+(X'X)AX'E(w)=0.(3)当
3、皿訂->1时,X*接近降秩矩阵,即
4、XX
5、tO,Va「(B)=/(Xg,变得很大。所以2丧失有效性。以二解释变量线性模型为例,当rv/Ay=0.8时,Var(p)为口“=0时的Var(p)的2.78倍。当rA,A>=0.95时,Va『(R)为八⑷二0时的Var(d)的10.26倍。4.多重共线性的检验(1)初步观察。当模型的拟合优度(尺2)很高,F值很高,而每个回归参数估计值
6、的方差Var(^)又非常大(即r值很低)时,说明解释变量间可能存在多重共线性。(2)Klein判别法。计算多重可决系数,及解释变量间的简单相关系数心护若有某个
7、rxjxj
8、>疋,则X"习间的多重共线性是有害的。(3)回归参数估计值的符号如果不符合经济理论,模型有可能存在多重共线性。(4)增加或减少解释变量个数时,回归参数估计值变化很大,说明模型有可能存在多重共线性。(5)此外还有其他一些检验方法,如主成分分析法等,很复朵。5.多重共线性的克服方法5」直接合并解释变量当模型屮存在多重共线性时,在不失去实际意义的前提下,可以把有关的解释变量直接合并,从而降低或
9、消除多重共线性。如果研究的目的是预测全国货运量,那么可以把重工业总产值和轻工业总产值合并为工业总产值,从而使模型中的解释变量个数减少到两个以消除多重共线性。甚至还可以与农业总产值合并,变为工农业总产值。解释变量变成了一个,自然消除了多重共线性。5.2利用已知信息合并解释变量通过经济理论及对实际问题的深刻理解,对发生多重共线性的解释变量引入附加条件从而减弱或消除多重共线性。比如有二元回归模型X二%+0iX/i+血力+⑷(7.20)q与疋间存在多重共线性。如果依据经济理论或对实际问题的深入调查研究,能给出回归系数伤与血的某种关系,例如加=邛(7.21)其中2
10、为常数。把上式代入模型(7.20),得升=%+01X/l+201无2+均二A)+01(X/1+AX/2)+⑷(7.22)令Xt=X/1+AXZ2得yf=A)+0ixt+ut(7.23)模型(7.23)是一元线性回归模型,所以不再有多重共线性问题。用普通最小二乘法估计模型(7.23),得到人,然后再利用(7.21)式求出念。下面以道格拉斯(Douglass)生产函数为例,做进一步说明。Y严(7.24)英中齐表示产出量,厶表示劳动力投入量,G表示资本投入量。两侧取自然对数后,LnYt=LnKi+aLnLt+pLnCt+ut(7.25)因为劳动力(厶》与资本(G
11、)常常是高度相关的,所以L也与SG也高度相关,致使无法求出弘0的精确估计值。假如己知所研究的对象属于规模报酬不变型,即得到一个条件0+0=1利用这一关系把模型(7.25)变为LnYt=LnKt+aLnLt+(1-a)LnCt+ut整理后,(7.26)Ln(—)=LnK(+aLn(—)+u{变成了对Ln(L,/Cf)的一元线性回归模型,自然消除了多重共线性。估计出a后,再利用关系式a+0=l,估计0。5.3增加样本容量或重新抽取样本这种方法主要适用于那些由测量误差而引起的多重共线性。当重新抽取样本时,克服了测量误差,自然也消除了多重共线性。另外,增加样本容量
12、也可以减弱多重共线性的程度。5.4合并截面数据与时间序列数据这种方法属于约束最小二乘法(RLS)。其基本思想是,先由截面数据求出一个或多个回归系数的估计值,再把它们代入原模型中,通过用因变量与上述估计值所对应的解释变量相减从而得到新的因变量,然后建立新因变量对那些保留解释变量的回归模型,并利用时间序列样本估计回归系数。下面通过一个例子具体介绍合并数据法。设有某种商品的销售量X模型如下,(7.29)LnYt=%+/}[LnPt+J?2LnIt+ut其中芥表示销售量,几表示平均价格,厶表示消费者收入,下标r表示时间。在时间序列数据中,价格件与收入厶一般高度相关
13、,所以当用普通最小二乘法估计模型(7.29)的回归系数时,会遇到多
此文档下载收益归作者所有