包含虚拟变量的回归分析

包含虚拟变量的回归分析

ID:27298848

大小:391.51 KB

页数:42页

时间:2018-12-01

包含虚拟变量的回归分析_第1页
包含虚拟变量的回归分析_第2页
包含虚拟变量的回归分析_第3页
包含虚拟变量的回归分析_第4页
包含虚拟变量的回归分析_第5页
资源描述:

《包含虚拟变量的回归分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第七讲包含虚拟变量的回归分析RegressionAnalysiswithDummyVariables一、什么是虚拟变量?二、自变量中包含虚拟变量三、因变量为虚拟变量一、什么是虚拟变量?什么是虚拟变量?变量的分类定类/类别变量(nominal/categoricalvariable)定序/有序变量(ordinalvariable)定距/定量变量(intervalvariable)问题:如何在计量分析中使用定类变量和定序变量什么是虚拟变量?对于只有两种取值的定类变量,可以用0和1表示这两种取值。这样的变量称为虚拟变量(dummyvariable)或二分变量(binaryvariable)。其中,赋

2、值为0的一组称为对照组(referencegroup)或基准组(benchmarkgroup)注意:变量名的选择什么是虚拟变量?对于有多个取值的定类变量,可构造多个虚拟变量来表示用east、central、west三个虚拟变量表示不同地区用sx、jy、qt三个虚拟变量表示本科生毕业后的状态什么是虚拟变量?对于定序变量和定距变量,也可以用虚拟变量表示学习成绩(定序变量)年收入(定距变量,但通过划分收入区间将之转换为虚拟变量)自变量中包含一个虚拟变量自变量中包含多个虚拟变量交互项二、自变量中包含虚拟变量自变量中包含一个虚拟变量自变量仅为一个虚拟变量如果自变量仅为一个虚拟变量,实际上是以自变量为分类

3、依据,分析因变量的均值差异自变量中包含一个虚拟变量例题7_1:工资差异自变量中包含一个虚拟变量自变量包含定距变量和一个虚拟变量此时,虚拟变量的回归系数表示在控制其它自变量的情况下,两组之间的差异例题7_2:课本p217,例7.2自变量中包含一个虚拟变量自变量包含定距变量和一个虚拟变量虚拟变量可用于政策分析,虚拟变量取值为0的一组称为控制组或对照组(controlgroup),取值为1的一组称为实验组(experimentalgroup)或处理组(treatmentgroup)例题7_3:课本p218,例7.3自变量中包含多个虚拟变量自变量中包含多个虚拟变量可分为三种情况每个虚拟变量代表不同的分

4、类若干个虚拟变量代表同一种分类,且这种分类是定类的若干个虚拟变量代表同一种分类,且这种分类是定序的自变量中包含多个虚拟变量每个虚拟变量代表不同的分类例题7_4:性别和婚姻状况对工资的影响(课本p220,例7.6)引入性别和婚姻状况两个虚拟变量上述结果表明,性别对工资有显著影响,但婚姻状况没有显著影响。这一模型可能存在问题,即假定婚姻状况的影响对于男性和女性是相同的。进一步的分析应考虑婚姻状况的影响存在性别差异。自变量中包含多个虚拟变量每个虚拟变量代表不同的分类例题7_4:性别和婚姻状况对工资的影响(课本p220,例7.6)虚拟变量的定义如果有n种分类,则回归时只能引入n-1个虚拟变量,否则会造

5、成完全共线性。未引入的即为对照组。下面是以单身男性为对照组的回归结果:lwageCoef.Std.Err.tP>t[95%Conf.Interval]mm0.21270.05543.84000.00000.10390.3214sf-0.11040.0557-1.98000.0480-0.2199-0.0008mf-0.19830.0578-3.43000.0010-0.3119-0.0846…………………自变量中包含多个虚拟变量每个虚拟变量代表不同的分类例题7_4:性别和婚姻状况对工资的影响(课本p220,例7.6)不同性别和婚姻状况个体的样本回归方程自变量中包含多个虚拟变量每个虚拟变量代表不

6、同的分类例题7_4:性别和婚姻状况对工资的影响(课本p220,例7.6)根据研究关注问题的不同,可以选择不同的对照组。下面是以已婚女性为对照组的回归结果:lwageCoef.Std.Err.tP>t[95%Conf.Interval]sm0.19830.05783.43000.00100.08460.3119mm0.41090.04588.98000.00000.32100.5009sf0.08790.05231.68000.0940-0.01490.1908…………………自变量包含多个虚拟变量若干个虚拟变量代表同一种分类,且这种分类是定类的例题7_5:工资的地区差异northcen=1表示中

7、北部地区west=1表示西部地区south=1表示南部地区other_region=1表示其他地区同样地,如果有n种分类,回归时只能引入n-1个虚拟变量!自变量中包含多个虚拟变量若干个虚拟变量代表同一种分类,且这种分类是定类的例题7_5:工资的地区差异——以其他地区为对照组lwageCoef.Std.Err.tP>tnorthcen-0.07830.0563-1.390.1650south-0.1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。