06 第五讲 模型设定和虚拟变量专题之虚拟变量

06 第五讲 模型设定和虚拟变量专题之虚拟变量

ID:20030023

大小:1.09 MB

页数:49页

时间:2018-10-08

06 第五讲 模型设定和虚拟变量专题之虚拟变量_第1页
06 第五讲 模型设定和虚拟变量专题之虚拟变量_第2页
06 第五讲 模型设定和虚拟变量专题之虚拟变量_第3页
06 第五讲 模型设定和虚拟变量专题之虚拟变量_第4页
06 第五讲 模型设定和虚拟变量专题之虚拟变量_第5页
资源描述:

《06 第五讲 模型设定和虚拟变量专题之虚拟变量》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、1第五讲模型设定和虚拟变量专题之虚拟变量y=b0+b1x1+b2x2+...bkxk+uchuanglian.weebly.com2前言前面有关多元回归模型的因变量和自变量都具有定量的含义,如小时工资率、受教育年数,大学平均成绩、企业销售水平等等。在经验分析中,每个变量的大小都传递了有用的信息,然而,经验分析还常常碰到定性的问题,如,一个人的性别、种族、企业所属行业以及城市所处的地理位置等等,当考虑这些因素作为变量时,则必须采用虚拟变量设置。前言其中,如果我们把上述定性变量作为自变量,就是本章要讲的虚拟变量设置,并估计的问题。如果我们把上述定性变量

2、作为因变量,则为线性概率模型,这些在微观计量经济学中用的比较多,教材也阐述一些,但是本章不讲解该部分的内容,因为如果讲清楚需要很足够时间,如果提到当讲不清楚,不如不讲,等后面以后再学之。3问题定性问题经常以二值信息形式出现:一个人是男还是女,结婚与否,一个人有还没有一台电脑等等。该问题可通过定义一个二值变量(binaryvariable)或一个0-1变量来刻画,此变量即为虚拟变量(dummyvariable)那么如何引入虚拟变量呢?4举例:一个虚拟变量设置设置原理如下:虚拟变量的取值虚拟变量的作用:举例,如类别变量性别变量5设置方式两种设置方式:(

3、1)保留常数项和其中一个虚拟变量(2)6举例:多虚拟变量举例:季节变量有四个状态7虚拟变量系数分析通过例子的形式介绍虚拟变量系数的含义:例子:虚拟变量,那么在其他条件相同的情况下,女人总体上挣的钱要比男人少。89Exampleofd0>0xy{d0}b0y=(b0+d0)+b1xy=b0+b1xslope=b1d=0d=11011例7.1是否存在性别歧视注意t值检验,同时,通常的对一个常数和一个虚拟变量进行简单回归时,是比较两组均值的直接方法,要通常的t统计量生效,我们还必须假定同方差性,这就意味着,对男人和女人而言,工资的总体方程式相同的。12例

4、7.2拥有计算机与大学GPA13例7.3培训津贴对培训小时数的影响问题的关键是:定性变量所度量的影响是否为因果性?办法之一是,尽可能控制与虚拟变量及因变量相关的因素。14当因变量为log(y)时对虚拟变量系数的解释当自变量中有一个或多个虚拟变量时,因变量以对数形式出现,虚拟变量的系数具有一种百分比解释。在保持其他因素不变的情况下,一套殖民地建筑风格的住房的卖价预计高出约5.4%。15当y有较大比例变化时,如何更准确估计y变化的百分比?1617多元分类的虚拟变量在应用研究中,我们需要使用多个虚拟变量。在控制性别的基础上,研究婚姻状态的影响;在区域研究

5、中,往往区分东、中、西部;在省级面板数据中,甚至会引入n-1个地区虚拟变量。虚拟变量可以描述包含序数的信息:信用等级18例7.6工资方程估计一个工资对如下四组都不同的模型:已婚男人、已婚女人、单身男人、单身女人。首先选择基组:单身男人,对剩下的每一组定义一个虚拟变量,并称之为marrmal,marrfem,和singfem。因此,三个虚拟变量的估计量度量的都是与单身男人相比,工资的比例差异。19如果要比较特定两组之间工资的差异,可以重新设定基组进行回归分析。例如,为检验单身女人和已婚女人之间的估计差异是否显著,以已婚女人组作为基组重新估计得到:在方

6、程中包括虚拟变量来象征不同组的一般原则:如果回归模型有g组或g类不同的截距,在模型中则包含g-1个虚拟变量和一个1截距。20通过虚拟变量来包含序数信息序数变量:穆迪或标准普尔对地方政府债券的质量进行了级别评定,假设等级范围从零到四,零为最低的信用等级,四位最高的信用等级,记为CR。然而,很难有意义地解释CR变化一个单位对MBR的影响。2122例7.7相貌吸引力对工资的影响在劳动力市场中,除了存在性别歧视之外,还可能存在相貌、身高等歧视。如果将样本相貌分为三类:一般水平、低于一般水平、高于一般水平,并以一般水平组作为基组,分别对男人、女人估计方程得:

7、2324例7.8法学院排名对起薪的影响2526涉及虚拟变量的交互作用虚拟变量之间的交互作用例7.6根据婚姻状况和性别定义了四个类别,在模型中引入三个虚拟变量,以单身男性为基组研究了不同类别之间的工资差异。除此之外,还有什么方法?27此外,我们还可以在female和married分别出现的模型中,增加一个female和married的交互项,同样可以进行组别工资差异比较。28例7.9计算机使用对工资的影响29容许出现不同的斜率虚拟变量之间的交互项反映的是截距之间的差异,斜率并未发生变化。含义是:样本回归曲线是平行的。虚拟变量与非虚拟变量之间也有交互作

8、用,使得出现不同的斜率。3031我们关心的两个假设:男性和女性受教育的回报是相同的。受教育水平相同的男性和女性的平均工资相

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。