资源描述:
《虚拟变量案例.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、虚拟变量(dummyvariable)在实际建模过程中,被解释变量不但受定量变量影响,同时还受定性变量影响。例如需要考虑性别、民族、不同历史时期、季节差异、企业所有制性质不同等因素的影响。这些因素也应该包括在模型中。由于定性变量通常表示的是某种特征的有和无,所以量化方法可采用取值为1或0。这种变量称作虚拟变量,用D表示。虚拟变量应用于模型中,对其回归系数的估计与检验方法与定量变量相同。1.截距移动设有模型,yt=b0+b1xt+b2D+ut,其中yt,xt为定量变量;D为定性变量。当D=0或1时,上述模型可表达为,b0+b1xt+ut,(D=0)yt=
2、(b0+b2)+b1xt+ut,(D=1)D=0D=1b0b0+b2图8.1测量截距不同D=1或0表示某种特征的有无。反映在数学上是截距不同的两个函数。若b2显著不为零,说明截距不同;若b2为零,说明这种分类无显著性差异。例:中国成年人体重y(kg)与身高x(cm)的回归关系如下:–105+xD=1(男)y=-100+x-5D=–100+xD=0(女)注意:①若定性变量含有m个类别,应引入m-1个虚拟变量,否则会导致多重共线性,称作虚拟变量陷阱(dummyvariabletrap)。②关于定性变量中的哪个类别取0,哪个类别取1,是任意的,不影响检验结果
3、。③定性变量中取值为0所对应的类别称作基础类别(basecategory)。④对于多于两个类别的定性变量可采用设一个虚拟变量而对不同类别采取赋值不同的方法处理。如:1(大学)D=0(中学)-1(小学)。8【案例1】中国季节GDP数据的拟合(虚拟变量应用,file:case1及case1-solve)GDP序列图不用虚拟变量的情形若不采用虚拟变量,得回归结果如下,GDP=1.5427+0.0405T(11.0)(3.5)R2=0.3991,DW=2.6,s.e.=0.3定义1(1季度)1(2季度)1(3季度)D1=D2=D3=0(2,3,4季度)0(1,
4、3,4季度)0(1,2,4季度)第4季度为基础类别。GDP=2.0922+0.0315T–0.8013D1–0.5137D2–0.5014D3(64.2)(15.9)(-24.9)(-16.1)(-15.8)R2=0.9863,DW=1.96,s.e.=0.058附数据如下:年GDPtD1D2D31996:11.315611001996:21.660020101996:31.591930011996:42.2209640001997:11.4685651001997:21.8494860101997:31.797270011997:42.3620800
5、01998:11.5899491001998:21.88316100101998:31.97044110011998:42.51176120001999:11.6784131001999:21.9405140101999:32.0611150011999:42.5254160002000:11.8173171002000:22.1318180102000:32.2633190012000:42.728020000数据来源:《中国统计年鉴》1998-20011.斜率变化以上只考虑定性变量影响截距,未考虑影响斜率,即回归系数的变化。当需要考虑时,可建立如下
6、模型:yt=b0+b1xt+b2D+b3xtD+ut,其中xt为定量变量;D为定性变量。当D=0或1时,上述模型可表达为,(b0+b2)+(b1+b3)xt+ut,(D=1)yt=b0+b1xt+ut,(D=0)通过检验b3是否为零,可判断模型斜率是否发生变化。图8.5情形1(不同类别数据的截距和斜率不同)图8.6情形2(不同类别数据的截距和斜率不同)例2:用虚拟变量区别不同历史时期(file:case2及case2-solve)中国进出口贸易总额数据(1950-1984)见上表。试检验改革前后该时间序列的斜率是否发生变化。定义虚拟变量D如下0(195
7、0-1977)D=1(1978-1984)8中国进出口贸易总额数据(1950-1984)(单位:百亿元人民币)年tradeTDT*D年tradeTDT*D19500.41510019681.085190019510.59520019691.069200019520.64630019701.129210019530.80940019711.209220019540.84750019721.469230019551.09860019732.205240019561.08770019742.923250019571.04580019752.904260019
8、581.28790019762.641270019591.493100019772.72528