rd方法(regression discontinuity design)

rd方法(regression discontinuity design)

ID:6119463

大小:561.50 KB

页数:7页

时间:2018-01-03

rd方法(regression discontinuity design)_第1页
rd方法(regression discontinuity design)_第2页
rd方法(regression discontinuity design)_第3页
rd方法(regression discontinuity design)_第4页
rd方法(regression discontinuity design)_第5页
资源描述:

《rd方法(regression discontinuity design)》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、RD方法(regressiondiscontinuitydesign)l什么是regressiondiscontinuitydesign?下面将用一篇文章来介绍:如何理解「由于使用燃煤取暖,中国5亿北方居民预期寿命将缩短5.5年」?7月8日发表在《美国国家科学院院刊》(PNAS)的一篇论文,向已经逐渐意识到空气污染危害的中国民众再次展现了残酷的现实:以淮河为界,烧煤供暖的中国北方地区空气污染水平高于中国南方,北方5亿居民因严重的空气污染,平均每人失去5年寿命。这篇文章由清华大学的李宏彬、北京大学的陈玉宇和另

2、外两位作者共同完成。前两位完成了这篇论文的主要部分。这个回答首先介绍他们的研究方法,再谈一谈研究者和媒体对这篇文章的引申。l科学家如何得出「使用燃煤取暖中国5亿北方居民预期寿命将缩短5.5年」这个结论的?首先要说的是这篇文章使用的RD方法(regressiondiscontinuitydesign),即断点回归方法。断点回归方法是最近的政策评估中非常重要的一个方法,他可以在没有随机性的情况下识别出政策的效果。在早期的研究中,要识别一个处理(Treatment)的效果,我们必须拥有随机性,比如两组随机分开的小

3、白鼠,一组加上某种处理,一组没有处理,最后观察两者的区别。为什么我们那么需要随机性呢?因为研究的基础需要几组十分类似的群体,他们的任何特征都服从一个相同的分布,无论是性别、年龄、教育、健康程度……这样,我们才能确定几组对象之间出现的差别是来自于实验处理的差异,而非某些个人特征。从一个大样本中严格随机抽取的样本,正好满足这样的同分布假设。但对于政策研究来说,我们不可能找到这样随机分开的两组人,而且也无法用实验的方法来获得结果——你能将随机分开的100人放在干净空气中,将另外100人放在肮脏空气中并观察一段时间

4、吗?一些研究者面对这种缺乏随机性的情况,采用了增加控制变量的方式。比如,把性别年龄教育健康程度全部放进回归式中,然后声称,两组人之间由于性别年龄教育健康的不同而造成的差别都已经去掉了,剩下的就是这个政策的效果了。可是,这很容易遭到批评,而且是没完没了的批评。为什么不控制工资高低?婚姻状况?从事行业?只要没有随机分开,任何特征变量的差异造成的结果,都可能混淆在政策结果中,你不控制这个变量,政策的效果就仍然没有识别干净。遭到批评的研究者只能继续加变量,没完没了的加变量。更关键的是,前面说的还是可以量化的东西,努

5、力程度?性格特征?甚至,智商?这些不可观测的变量可能影响更大。举一个例子,科学家想知道上了“一本”大学对学生未来的工资有什么影响。上了一本和没上一本的大学生,显然不是随机分开的两个群体。当然也没法用控制变量的方法来消除“一本”之外的影响,因为肯定有一些不可观测的变量是你控制不了的。控制变量法至此完败。但科学家并没有束手无策,他们找到了RD方法。所谓RD方法,就是观察那些在一本线上下2分的学生,看“上一本”和“没上一本”的学生的未来工资差异。这个想法的天才之处在于,高考的上下5分,实在是一件随机性非常大的事情

6、。让这批学生重新考一次,不少学生的情况可能就要逆转。对于这5分区间内的学生来说,一条一本线,就像一个天然的分割线,将两组人随机分开了。退一步说,即使我们将高考视为一项没有随机性的考试,RD方法还有另外一个假设——连续性假设。那些刚好上了一本的学生,比起差几分没上一本的学生,可能要聪明一点;也可能家庭环境好一点,请了好一点的家庭教师;也可能更努力一些,多做了几道习题。但注意,如果我们将智商、努力程度、家庭环境等等变量都视为连续的变量,那么上了一本的学生,比起没上一本的,也只是多了那么“一点点”。于是,我们可以

7、开始观察这批学生的工资了。RD方法的所有目光,都聚焦在了那个“间断点”上。首先看一本线下1分的学生,和线下2分的学生,线上2分的学生和线上1分的学生,是否有工资差别?直观上想,可能没有,可能前者比后者高10块,这说明在没有其他显著差别时,各种连续变量产出的工资,也应该是一个连续变量。但我们再看线上0分的学生,和线下1分的学生时,显著的工资差异出现了,乖乖,差1000块。线上0分的学生,和线下1分的学生,各种特征都应该是差不多的,即便有差别,在连续性假设下也应该是很小很小的差别,那么产生这样显著的工资差异,只

8、能由前者上了一本,而后者没上一本来解释了,因为这是两者间唯一的区别。于是,科学家们说,“上一本”这个事情,可以增加大学生大约1000元工资。我们回到这篇论文上,作者正是观察到了这样一条天然的分割线:淮河以北地区,政府提供了暖气,用烧煤的方式进行,而淮河以南则没有。那么,淮河两岸十分接近的两个地区,理论上来说也应该服从这样的“连续性”假设,也就是各种变量都差不多,唯一的区别就是有没有烧煤。于是作者发现,由于烧煤,淮

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。