欢迎来到天天文库
浏览记录
ID:39731120
大小:273.51 KB
页数:34页
时间:2019-07-10
《本科经济计量学第7章第》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第7章模型选择:标准与检验我们前面已经提到过模型的设定误差,在实际应用中,我们应尽量避免出现设定误差,这就需要我们在选择模型的时候要特别注意。本章主要考虑下列问题:(1)“好的”或者“正确的”模型有哪些性质?(2)在实践中可能会犯哪些类型的设定误差?(3)设定误差的后果是怎样的?(4)如何诊断设定误差?(5)出现设定误差的补救措施有哪些?7.1“好的”模型具有的性质7.2设定误差的类型7.3遗漏相关变量:“过低拟合”模型7.4包括不相关变量:“过度拟合”模型7.5不正确的函数形式7.6度量误差7.7诊断设定误差:设定误差的检验7.8小结7.1“好的”模型具有的特性简约性(节省性)-
2、---模型应尽可能的简单可识别性----每个参数只有一个估计值拟合优度高----拟合优度越大越好理论一致性----与理论相合而非相背预测能力好----理论预测能被实际经验所验证7.2设定误差的类型1.遗漏相关变量:“过低拟合”模型2.包括不相关变量:“过度拟合”模型3.采用了错误的函数形式4.度量误差7.3遗漏相关变量:“过低拟合”模型考虑习题4.14中的数据,并考虑如下回归:Yi=B1+B2X2i+B3X3i+ui(7-1)其中Y:婴儿死亡率;X2:人均GNP;X3:女性识字率。如果我们采用并估计的是下面的方程:Yi=A1+A2X2i+vi(7-2)返回(7-6)返回残差检验也称
3、“不足拟合”注意此时vi的性质:vi中包含B3X3i+ui。这就可能会产生遗漏重要解释变量的错误。返回(7-12)由于遗漏了变量X3t,若该变量是重要变量,则会出现遗漏变量偏差,可能会产生如下后果:(1)如果X3与X2相关,则估计量a1和a2是有偏和不一致的(2)如果X3与X2不相关,则估计量a2是无偏和一致的(3)误差方差的估计是有偏的(4)估计量a2的方差是有偏的(5)置信区间和假设检验不可靠例7.1婴儿死亡率的决定因素利用表4-7给出的数据,式(7-1)的回归结果如下:CMi=263.6416-0.0056PGNPi-2.2316FLRise=(11.5932)(0.0019
4、)(0.2099)(7-6)t=(22.74)(-2.8187)(-10.629)σ2=106315.6;R2=0.6981;而错误设定式(7-2)的回归结果为:CMi=157.4244-0.0114PGNPise=(9.8455)(0.0032)(7-7)t=(15.989)(-3.5157)σ2=303228.5;R2=0.1528;返回(7-13)(1)错误设定式表明:PGNP每增加1美元,平均而言婴儿死亡率降低约0.01。真实模型表明,PGNP每增加1美元,平均而言婴儿死亡率降低约0.006。错误设定方程高估了(绝对值)PGNP对CM的影响。注意两个回归结果有如下几个特点:
5、(2)截距也是有偏的,本例中低估了真实的截距值(比较方程(7-6)和(7-7))(3)从两个模型中所估计的RSS也明显不同(4)截距和斜率的标准差也明显不同(5)两模型的判定系数也有明显不同7.4包括不相关变量:“过度拟合”模型为避免遗漏相关变量,将可能相关的所有的变量都包括进模型中是否可行?此时有可能犯“过度拟合”或者“过度设定”模型(也就是说包括非必须变量)的错误。这有可能是因为经济理论不完善,或者研究人员不能确定变量在模型中的作用。模型中包括非相关变量会导致什么后果呢?我们仍用简单的双变量和三变量模型加以说明。假设:Yi=B1+B2X2i+ui(7-9)是正确设定的模型,但是
6、,某研究者却加入了多余的变量X3,估计了以下的模型:Yi=A1+A2X2i+A3X3i+vi(7-10)这里,设定误差是过度拟合了模型,此时,R2值会增加(若增加变量系数的t值的绝对值大于1,则校正后的R2也会增加),从而增加模型的预测能力。其它后果如下:(1)“不正确”模型(7-10)的OLS估计量是无偏的(也是一致的)。(2)从回归方程(7-10)中所得的σ2的估计量是合适的估计值。(3)标准的置信区间和假设检验仍然是有效的。(4)但是回归方程(7-10)中估计的参数的方差通常比从真实模型(7-9)中估计的大。因此,尽管假设-检验是有效的,但是估计的系数值没有根据正确模型所估计
7、的真实值那么精确。简言之,OLS估计量是线性无偏估计量,但不是最优线性无偏估计量。从上述讨论中我们注意到:遗漏相关变量比包括不相关变量的后果要严重一些。但是通常并不鼓励为避免遗漏相关变量而包括可能不相关的变量,因为:1.不必要变量的增加会减少估计量的有效性(即更大的标准差);2.可能导致多重共线性问题;3.自由度的损失更大。所以正确选择变量是非常重要的。7.5不正确的函数形式现在考虑另外一种设定误差。假设模型所包括的变量Y,X2,X3都是理论上正确的变量,考虑如下两种
此文档下载收益归作者所有