欢迎来到天天文库
浏览记录
ID:27886713
大小:726.34 KB
页数:56页
时间:2018-12-05
《多重共线和虚拟变量的应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第四章多重共线性和虚拟变量的应用1本章要点多重共线性的含义多重共线性产生的原因多重共线性的后果判断多重共线性的方法及其修正方法虚拟变量的设置原则虚拟变量模型的应用邹氏检验的做法及缺陷虚拟变量法检验结构稳定性的优点2多重共线性的概念多重共线性(multicollinearity)一词最早由挪威经济学家弗瑞希(R.Frisch)于1934年提出。其原义是指回归模型中的一些或全部解释变量中存在的一种完全(perfect)或准确(exact)的线性关系。而现在所说的多重共线性,除指上述提到的完全多重共线性(perfectmulticollinearity),也包括近似多
2、重共线性(nearmulticollinearity)。3为对上述两概念加以区别,我们以一组解释变量为例如果存在一组不完全为零的常数满足,即任一变量都可以由其它变量的线性组合推出,则这组变量满足完全多重共线性。若变量组,满足如下关系式,其中u表示随机误差项,即某一变量不仅取决于其它变量的线性组合,也取决于随机误差项,此时变量组之间存在非严格但近似的线性关系,解释变量之间高度相关,也即变量组存在近似多重共线性关系。4多重共线性产生的原因多重共线性问题在金融数据中是普遍存在的,不仅存在于时间序列数据中,也存在于横截面数据中。具体而言,多重共线性产生的原因主要有以下几点
3、:(1)数据收集及计算方法。(2)模型或从中取样的总体受到限制。(3)模型设定偏误。此外,在观测值个数较少,以至于小于解释变量个数时,也会产生多重共线性;时间序列数据中,若同时使用解释变量的当期值和滞后值,由于当期值和滞后值之间往往高度相关,也容易产生多重共线性。5多重共线性的后果多重共线性不会改变最小二乘估计的无偏性,但在解释变量之间存在严重的多重共线性而被忽略时,会对模型的估计、检验与预测产生严重的不良后果。以某一离差形式(即)表示的二元线性回归模型为例若存在完全多重共线性,假设存在关系常数。则的估计值同理也是无法确定的,即不能求得参数估计值。6而对于参数估计
4、值的方差,有同理,的方差也是无限大的。因此,当存在完全多重共线性时,我们将不能求得参数估计值,参数估计值的方差无限大。当存在近似多重共线性时,尽管可以求得参数估计值,但它们是不稳定的,同时参数估计值的方差将变大,变大的程度取决于多重共线性的严重程度。7在实际金融数据中,完全多重共线性只是一种极端情况,各种解释变量之间存在的往往是近似多重共线性,因此通常所说多重共线性造成的后果是指近似多重共线性造成的后果,具体而言,它将造成如下的后果:(1)回归方程参数估计值将变得不精确,因为较大的方差将会导致置信区间变宽。(2)由于参数估计值的标准差变大,t值将缩小,使得t检验有
5、可能得出错误的结论。(3)将无法区分单个变量对被解释变量的影响作用。8多重共线性的检验如前所述,多重共线性普遍存在于金融、经济数据中,因此对多重共线性的检验并不是要确定其是否存在,而是要确定多重共线性的程度。由于多重共线性是对被假定为非随机变量的解释变量的情况而言的,所以它是一种样本而非总体特征,这决定了我们只能以某些经验法则(rulesofthumb)来检验模型的多重共线性。对多重共线性的检验主要包括以下内容:(1)检验多重共线性问题是否严重(2)多重共线性的存在范围,即确定多重共线性是由哪些主要变量引起的。(3)多重共线性的表现形式,即找出与主要变量有共线性的
6、解释变量。9检验多重共线性问题是否严重若回归模型的值高(如>0.8),或F检验值显著,但单个解释变量系数估计值却不显著;或从金融理论知某个解释变量对因变量有重要影响,但其估计值却不显著,则可以认为存在严重的多重共线性问题。若两个解释变量之间的相关系数高,比如说大于0.8,则可以认为存在严重的多重共线性。10判断多重共线性的存在范围要确定多重共线性是由哪些主要变量引起的,可以采用辅助回归法(auxiliaryregressionmethod)。所谓辅助回归是指某一解释变量对其余解释变量的回归,区别于因变量对所有解释变量回归的主回归(mainregression)。辅
7、助回归法构造的检验统计量定义如下:服从自由度为k-1与n-k的F分布其中(i=1,2,…k)为第i个解释变量关于其余解释变量的辅助回归的拟和优度,k为解释变量的个数,n代表样本容量。11检验多重共线性的表现形式当确定多重共线性是由哪些主要变量引起后,若要找出与主要变量有共线性的解释变量,即确定多重共线性的表现形式,可采用偏相关系数法。解释变量与偏相关系数即是在其它的解释变量固定的情况下它们之间的相关系数。偏相关系数法构造的检验统计量定义如下:,服从自由度为n-k-1的t分布其中n为样本容量,k为解释变量的个数,为与的偏相关系数。若显著不为零,则认为、是引起多重共线
8、性的原因,
此文档下载收益归作者所有