虚拟变量在线性回归模型中的应用-章晓英

虚拟变量在线性回归模型中的应用-章晓英

ID:36641530

大小:647.10 KB

页数:5页

时间:2019-05-13

虚拟变量在线性回归模型中的应用-章晓英_第1页
虚拟变量在线性回归模型中的应用-章晓英_第2页
虚拟变量在线性回归模型中的应用-章晓英_第3页
虚拟变量在线性回归模型中的应用-章晓英_第4页
虚拟变量在线性回归模型中的应用-章晓英_第5页
资源描述:

《虚拟变量在线性回归模型中的应用-章晓英》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、第12卷第2期重庆工业管理学院学报1998年4月Vol.12No.2JournalofChongqingInstituteofTechnologyManagementApr.1998虚拟变量在线性回归模型中的应用章晓英(重庆工业管理学院经济学系重庆400050)摘要借助虚拟变量,在线性回归模型中引入品质标志,使模型更完善;运用虚拟变量改变回归直线的截距、斜率;虚拟变量既可作自变量,又可作因变量;灵活应用虚拟变量可以使许多复杂的问题简单化。关键词虚拟变量自变量因变量线性回归模型0引言在回归分析中,因变量除了受到通常的量变量的影响外,有时还会受

2、到质变量的影响。质变量不是数量的反映,而是反映某种本质或属性,在统计上称为品质标志,如性别、民族、季节、战争等。比如研究性别与收入的关系,战时和平时个人收入与个人储蓄的关系,销售量与季节的关系等等。1虚拟变量的实质虚拟变量(DummyVariable),又称虚设变量、名义变量或哑变量,是量化了的质变量,通常取值为0或1。现在我们来研究收入(yi)与性别的关系:定义虚拟变量Di=0时表示女性,Di=1时表示男性,即:1(男性)Di=0(女性)建立线性回归模型:yi=+Di+i其中,yi代表收入,、是总体回归参数,i是误差项。可以通过

3、检验假设H0:=0来说明收入与性别是否有关。在≠0时,说明收入与性别有关,借助Di、yi可分解为两个式子:+(男性)yi=(女性)研究战时和平时个人储蓄(Si)与个人收入(yi)的关系。设平时Si=1+yi+i战时Si=2+yi+i定义虚拟变量Di:1(战时)Di=0(平时)则回归模型变为:Si=1+(2-1)Di+yi+i可见,引入虚拟变量可使线性回归模型变得更复杂,但对问题的描述更简明,一个方程能达到两个方程的作用,而且接近现实。在引入虚拟变量时应注意,如果一个属性有m个类型,只引入(m-1)个虚拟变量,就

4、会产生多重共线性。若在上例中引入两个虚拟变量:1(平时)1(平时)D1i=D2i=0(战时)0(战时)收稿日期:1997—10—13章晓英:虚拟变量在线性回归模型中的应用·85·回归模型为:Si=1D1i+2D2i+yi+i则有D1i+D2i=1,是典型的多重共线性,不能简单使用最小二乘法。再看一个有多个虚拟变量的例子,研究高校教师收入(yi)与教龄(Xi)的关系时,考虑教师的学历。把教师学历分为本科、硕士、博士,引入两个虚拟变量:1(学历为硕士)1(学历为博士)D1i=D2i=0(其它)0(其它)当D1i=D2i=0时,代表学历为

5、本科。则有:yi=0+1D1i+2D2i+Xi+i2>1>0可分解为下面三个方程:0+xi+i(本科)yi=(0+1)+xi+i(硕士)(0+2)+xi+i(博士)2运用虚拟变量改变回归直线的截距前面两例就属于这种情况,这里再举一例。某企业工人分技工和普通工,研究工人收入(yi)与劳动量(xi)的关系,如图1。从这两条直线形状来看,它们趋势都相同,是两条平行的,但截距不同的直线,截距不同是因为技工和普通工的基本工资不同。图1截距不同斜率相同时工人收入与劳动量的关系1(技工)定义虚拟变量:Di=0(普通工)建

6、立线性回归模型:yi=+1Di+2xi+i(1>0)(+1)+2xi+i(技工)即:yi=+2xi+i(普通工)从上式可看到,代表技工的直线截距为+1,另一直线截距为,因此,用一个方程就可以表示截距不同的两条直线。3运用虚拟变量改变回归直线的斜率仍研究工人收入(yi)与劳动量(xi)的关系,现在假设技工与普通工基本工资一样,但单位劳动量的报酬不同。两条直线截距相同,斜率不同,见图2。·86·重庆工业管理学院学报图2截距相同斜率不同时工人收入与劳动量的关系1(技工)定义虚拟变量:Di=,这时的线性回归模型要复杂些,

7、形式如下:0(普通工)yi=+1xi+2(Dixi)+i这样,我们可以用上面的公式表示以下两种情况:+(1+2)xi+i(技工)yi=+1xi+i(普通工)由此可见,两条直线斜率不同,上面一条斜率是(1+2),而较低直线斜率为1。所以,我们同样可用含有虚拟变量的一个方程就表示了斜率不同的两种情况。4运用虚拟变量同时改变回归直线的斜率和截距对前面谈到的两种情况,在实际工作中经常同时发生,技工比起普通工,不但基本工资较高,而且单位劳动量的报酬也会高一些。又如教授的工资高于讲师,教授的课时费有时也比讲师高。图3就是这一类

8、现象的表现。图3截距和斜率都不同时工人收入与劳动量的关系1(技工)定义虚拟变量:Di=0(普通工)回归模型如下:yi=+1Di+2xi+3(Dixi)+i

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。