包含虚拟变量的回归模型

包含虚拟变量的回归模型

ID:27297712

大小:395.51 KB

页数:27页

时间:2018-12-01

包含虚拟变量的回归模型_第1页
包含虚拟变量的回归模型_第2页
包含虚拟变量的回归模型_第3页
包含虚拟变量的回归模型_第4页
包含虚拟变量的回归模型_第5页
资源描述:

《包含虚拟变量的回归模型》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、1第6章 包含虚拟变量的回归模型MultipleRegressionAnalysis:Dummyvariables26.1虚拟变量的性质虚拟变量(dummyvariable),又称哑变量,是其值只取1或0的变量,一般在回归模型中用D表示。现实中的很多定性的因素,往往不能用具体的数值表示出来,而使用哑变量则可以更好的描述。比如,性别、种族、肤色、结婚与否、是否是基地班、是否是班干部、是否是党员、是否有男女朋友等等。诸如此类的定性因素,一般可以用哑变量来进行描述。例如:定义性别变量female,如果是女性,female=1,如果是男性,female=0。那么,f

2、emale就是一个虚拟变量。36.1虚拟变量的性质:例子工资决定的例子wage=b0+b1female+u假设E(u)=0E(wage

3、female=1)=b0+b1表示的是女性的平均工资水平E(wage

4、female=0)=b0表示的是男性的平均工资水平b1代表了女性与男性之间的平均工资差别。4虚拟变量:工资决定模型使用wage.raw(wooldridge),估计结果如下:wâge=7.099–2.512female(0.21)(0.30)n=526R2=0.1157F=68.54所以,女性的平均小时工资(female=1)为7.099-2.512=4.

5、588美元。男性的平均小时工资(female=0)为7.099则女性比男性的平均小时工资低2.512美元(即对应虚拟变量的回归系数)。56.2包含一个定量变量,一个虚拟变量的回归模型wage=b0+b1female+b2educ+ufemale仍然是一个性别虚拟变量,取值同前E(wage

6、female=0,educ)=b0+b2educ给定受教育水平,男性的平均小时工资E(wage

7、female=1,educ)=b0+b1+b2educ给定受教育水平,女性的平均小时工资b1仍然是男女之间的平均小时工资差别。男女的平均小时工资对教育(educ)具有相同的斜率,

8、不同的截距。表明,无论男女都有相同的教育收益,即工资对教育的变动都为b2。66.2工资决定模型:例子wâge=0.623-2.273female+0.506educSe=(0.673)(0.279)(0.050)p=(0.355)(0.000)(0.000)n=526R2=0.2588Adj-R2=0.2560F=91.327educwageb0+b1=-1.651wâge=-1.651+0.506educslope=b1female=1b0=0.623wâge=0.623+0.506educfemale=08虚拟变量的性质1、如果一个定性变量只有两个取值,

9、那么在模型中,我们只需加入一个虚拟变量即可。比如性别变量,我们可以设定个虚拟变量D,当性别为男时D=1,性别为女是D=0。不需要设置两个虚拟变量,否则则会出现完全共线性,无法进行估计。因此,一个基本的原则是,如果定性变量有m个类别,我们则需要取m-1个虚拟变量。2、虚拟变量的赋值是任意的,根据各个研究偏好。3、取值为0的一类一般常为基准类或对比类等。比如,前文的例子中female=0,即男性是基准类。即模型估计结果得到的截距直接代表基准类男性的平均工资水平。4、虚拟变量D的系数称为差别截距系数,它表明了D=1与基准类截距的差别。因此前文的b1表示女性与男性的

10、平均工资差别。9刚才估计的例子wâge=0.623-2.273female+0.506educSe=(0.673)(0.279)(0.050)p=(0.355)(0.000)(0.000)n=526R2=0.2588Adj-R2=0.2560F=91.32当性别固定时,受教育程度每增加1年,其平均小时工资水平将增加0.506美元。当受教育程度固定不变时,女性的平均小时工资比男性的少2.273美元。男性的平均小时工资wâge=0.623+0.506educ女性的平均小时工资wâge=-1.651+0.506educ106.3虚拟变量有多种分类的情况有时我们所考

11、察的定性变量会超过2个值,这时我们不能单纯的用数字的形式表示,也无法用刚才0或1的数值形式表示。要用多个虚拟变量来进行分解。比如对于受教育程度,我们现在不是用具体的受教育年限来反应,而是用下列三类来反应不同的受教育的程度:未达到中学水平,中学水平及大学水平。这时我们不能用令未达到中学水平为0,中学水平为1,大学水平为2的形式(?)。我们可以使用两个虚拟变量来分解受教育程度这一因素,比如定义D2=1表示为中学水平,D2=0表示非中学水平;同样用D3=1表示大学水平,而D3=0表示非大学水平。11例子:工资决定wage=b0+b1exper+b2D2+b3D3+

12、u其中则E(wage

13、exper,D2=0,D3=0

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。