欢迎来到天天文库
浏览记录
ID:5467390
大小:268.50 KB
页数:48页
时间:2017-12-13
《教学讲稿多重共线性》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第六章多重共线性(Multi-Collinearity)第一节多重共线性的定义第二节多重共线性的检验第三节多重共线性的消除第一节多重共线性的定义多重量共线性及产生原因多重共线性的后果一、多重共线性的概念及其产生原因解释变量之间存在较强的线性相关关系,使得的行列式值近似于0(等于0是完全共线性),逆阵可求得,但不稳定。出现于多元线性模型。例:生产函数、需求函数.1、多重共线性定义对于模型i=1,2,…,n(6.1)其基本假设之一是解释变量是互相独立的。如果某两个或多个解释变量之间出现了近似相关性,则称为多重共线性。如果存在i=1,2,…,n(6.2)其中:不全为0,即某一个解释变量可
2、以用其它解释变量的线性组合表示,则称为解释变量间存在完全共线性。如果存在i=1,2,…,n(6.3)其中不全为0,为随机误差项,则称为一般共线性(近似共线性)或交互相关(intercorrelated)。在矩阵表示的线性回归模型Y=XB+N中,完全共线性指:秩(X)3、入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。滞后变量的引入在计量经济模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。一般经验对于采用时间序列数据作样本、以简单线性形式建立的计量经济学模型,往往存在多重共线性。以截面数据作样本时,问题不那么严重,但多重共线性仍然是存在的。3.多重共线性产生的原因:综上所述,多重共线性产生的原因大概有以下三点:(1)经济变量之间的内在联系(2)经济发展的“共向性”(34、)模型中含有滞后变量二、多重共线性的后果二、多重共线性的影响1.难以区分解释变量的单独影响(估计值可得,但误差增大);例:有多个因素的农业生产函数、方差扩大因子2.T检验可靠性降低,通常会出现较小的T值和较大的F值,R2亦大。从理论上讲,估计值仍是BLUE。(容易剔除重要的解释变量)3.参数估计值不稳定,模型缺乏稳定性;4、完全共线性下参数估计量不存在(过程可略)如果存在完全共线性,则(X’X)-1不存在,无法得到参数的估计量。5、近似共线性下普通最小二乘法参数估计量非有效在一般共线性(或称近似共线性)下,虽然可以得到OLS法参数估计量,但是由参数估计量方差的表达式为可见,由于此时5、6、X’X7、0,引起(X’X)-1主对角线元素较大,从而使参数估计值的方差增大,OLS参数估计量非有效。即:多重共线性使参数估计值的方差增大,方差扩大因子(VarianceInflationFactor)为1/(1-r2),其增大趋势见下表:6、参数估计量经济含义不合理如果模型中两个解释变量具有线性相关性,例如X1和X2,那么它们中的一个变量可以由另一个变量表征。这时,X1和X2前的参数并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。所以各自的参数已经失去了应有的经济含义,于是经常表现出似乎反常的现象,例如本来应该是正的,结果恰是负的。7、变量的显著性检8、验失去意义存在多重共线性时参数估计值的方差与标准差变大使t统计量的拒绝域变小(临界值增大)容易使通过样本计算的t值小于临界值,误导作出参数为0的推断可能将重要的解释变量排除在模型之外8、模型的预测功能失效变大的方差容易使区间预测的“区间”变大,使预测失去意义。能否说:如果存在完全共线性,预测值的置信区间为(-∞,+∞)?第二节、多重共线性的检验由于多重共线性表现为解释变量之间具有相关关系,所以用于多重共线性的检验方法主要是统计方法:如判定系数检验法、逐步回归检验法等,在多重共线性十分明显时,经验检验法,即综合统计检验法亦可。多重共线性检验的任务是:(1)检验多重共线性是否存在;(29、)估计多重共线性的范围,即判断哪些变量之间存在共线性。1、检验多重共线性是否存在(1)对两个解释变量的模型,采用简单相关系数法求出X1与X2的简单相关系数r,若10、r11、接近1,则说明两变量存在较强的多重共线性。(2)对多个解释变量的模型,采用综合统计检验法若在OLS法下,模型的R2与F值较大,但各参数估计值的t检验值较小,说明各解释变量对Y的联合线性作用显著,但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨,故t检验不显著。这是一种经验检验。2、判明存在多重共线
3、入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。滞后变量的引入在计量经济模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。一般经验对于采用时间序列数据作样本、以简单线性形式建立的计量经济学模型,往往存在多重共线性。以截面数据作样本时,问题不那么严重,但多重共线性仍然是存在的。3.多重共线性产生的原因:综上所述,多重共线性产生的原因大概有以下三点:(1)经济变量之间的内在联系(2)经济发展的“共向性”(3
4、)模型中含有滞后变量二、多重共线性的后果二、多重共线性的影响1.难以区分解释变量的单独影响(估计值可得,但误差增大);例:有多个因素的农业生产函数、方差扩大因子2.T检验可靠性降低,通常会出现较小的T值和较大的F值,R2亦大。从理论上讲,估计值仍是BLUE。(容易剔除重要的解释变量)3.参数估计值不稳定,模型缺乏稳定性;4、完全共线性下参数估计量不存在(过程可略)如果存在完全共线性,则(X’X)-1不存在,无法得到参数的估计量。5、近似共线性下普通最小二乘法参数估计量非有效在一般共线性(或称近似共线性)下,虽然可以得到OLS法参数估计量,但是由参数估计量方差的表达式为可见,由于此时
5、
6、X’X
7、0,引起(X’X)-1主对角线元素较大,从而使参数估计值的方差增大,OLS参数估计量非有效。即:多重共线性使参数估计值的方差增大,方差扩大因子(VarianceInflationFactor)为1/(1-r2),其增大趋势见下表:6、参数估计量经济含义不合理如果模型中两个解释变量具有线性相关性,例如X1和X2,那么它们中的一个变量可以由另一个变量表征。这时,X1和X2前的参数并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。所以各自的参数已经失去了应有的经济含义,于是经常表现出似乎反常的现象,例如本来应该是正的,结果恰是负的。7、变量的显著性检
8、验失去意义存在多重共线性时参数估计值的方差与标准差变大使t统计量的拒绝域变小(临界值增大)容易使通过样本计算的t值小于临界值,误导作出参数为0的推断可能将重要的解释变量排除在模型之外8、模型的预测功能失效变大的方差容易使区间预测的“区间”变大,使预测失去意义。能否说:如果存在完全共线性,预测值的置信区间为(-∞,+∞)?第二节、多重共线性的检验由于多重共线性表现为解释变量之间具有相关关系,所以用于多重共线性的检验方法主要是统计方法:如判定系数检验法、逐步回归检验法等,在多重共线性十分明显时,经验检验法,即综合统计检验法亦可。多重共线性检验的任务是:(1)检验多重共线性是否存在;(2
9、)估计多重共线性的范围,即判断哪些变量之间存在共线性。1、检验多重共线性是否存在(1)对两个解释变量的模型,采用简单相关系数法求出X1与X2的简单相关系数r,若
10、r
11、接近1,则说明两变量存在较强的多重共线性。(2)对多个解释变量的模型,采用综合统计检验法若在OLS法下,模型的R2与F值较大,但各参数估计值的t检验值较小,说明各解释变量对Y的联合线性作用显著,但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨,故t检验不显著。这是一种经验检验。2、判明存在多重共线
此文档下载收益归作者所有