用R语言进行分位数回归

用R语言进行分位数回归

ID:43462772

大小:187.16 KB

页数:26页

时间:2019-10-03

用R语言进行分位数回归_第1页
用R语言进行分位数回归_第2页
用R语言进行分位数回归_第3页
用R语言进行分位数回归_第4页
用R语言进行分位数回归_第5页
资源描述:

《用R语言进行分位数回归》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、用R语言进行分位数回归:基础篇詹鹏(北京师范大学经济管理学院北京)本文根据文献资料整理,以介绍方法为主要目的。作者的主要贡献有:(1)整理了分位数回归的一些基本原理和方法;(2)归纳了用R语言处理分位数回归的程序,其中写了两个函数整合估计结果;(3)写了一个分位数分解函数来处理MM2005的分解过程;(4)使用一个数据集进行案例分析,完整地展现了分析过程。第一节 分位数回归介绍(一)为什么需要分位数回归?传统的线性回归模型描述了因变量的条件均值分布受自变量X的影响过程。其中,最小二乘法是估计回归系数的最基本方法。如果模型的随机误差

2、项来自均值为零、方差相同的分布,那么回归系数的最小二乘估计为最佳线性无偏估计(BLUE);如果随机误差项是正态分布,那么回归系数的最小二乘估计与极大似然估计一致,均为最小方差无偏估计(MVUL)。此时它具有无偏性、有效性等优良性质。但是在实际的经济生活中,这种假设通常不能够满足。例如当数据中存在严重的异方差,或后尾、尖峰情况时,最小二乘法的估计将不再具有上述优良性质。为了弥补普通最小二乘法(OLS)在回归分析中的缺陷,1818年Laplace[2]提出了中位数回归(最小绝对偏差估计)。在此基础上,1978年Koenker和Bass

3、ett[3]把中位数回归推广到了一般的分位数回归(QuantileRegression)上。分位数回归相对于最小二乘回归,应用条件更加宽松,挖掘的信息更加丰富。它依据因变量的条件分位数对自变量X进行回归,这样得到了所有分位数下的回归模型。因此分位数回归相比普通的最小二乘回归,能够更加精确第描述自变量X对因变量Y的变化范围,以及条件分布形状的影响。(二)一个简单的分位数回归模型[4]假设随机变量的分布函数为                                                             (1)

4、Y的分位数的定义为满足的最小值,即                                             (2)回归分析的基本思想就是使样本值与拟合值之间的距离最短,对于Y的一组随机样本,样本均值回归是使误差平方和最小,即                                                                           (3)样本中位数回归是使误差绝对值之和最小,即                                                  

5、                            (4)样本分位数回归是使加权误差绝对值之和最小,即                                          (5)上式可等价表示为:   其中,为检查函数(checkfunction),定义为:   其中,为指示函数(indicatorfunction),z是条件关系式,当z为真时,;当z为假时,。同线性方程y=kx比较,相当于直线的斜率k,可以看出,为分段函数,如下图所示。现假设因变量Y由k个自变量组成的矩阵X线性表示,对于条件均值函数,通过求解(

6、8)式得到参数估计值对于条件分位数函数,通过求解(9)式得到参数估计值式中,函数表示取函数最小值时的取值。(三)分位数回归模型的参数估计算法1、主要算法(1)单纯形算法(SimplexMethod)Koenker和Orey[5](1993)把分两步解决最优化问题的单纯形算法[6]扩展到所有回归分位数中。该算法估计出来的参数具有很好的稳定性,但是在处理大型数据时运算的速度会显著降低。(2)内点算法(InteriorPointMethod)由于单纯形算法在处理大型数据时效率低下,Karmarker提出了内点算法[7];Portnoy和

7、Koenker把这种方法是用在分位数回归中,得出了处理大型数据时内点算法的运算速度远快于单纯形算法的结论。但内点算法每计算一步都要进行因数分解,当自变量比较多的时候效率比较低。其次,如果要达到和单纯形算法一样的精度,就必须进行舍入步骤的计算,者也降低了算法的运行效率。(3)平滑算法(SmoothingMethod)上述两种算法都有各自的优点和不足,而有限平滑算法则是一种同时兼顾运算效率以及运算速度的方法。Chen把这种算法扩展到计算回归分位数中[8]。2、R语言quantreg包中的假设检验加载quantreg包以后,使用summ

8、ary()函数或summary.rq()函数,可以得到参数系数的一些假设检验统计量。其实,以上两个函数是一致的。在使用summary()的时候,如果sumamry()加载的模型(对象)是分位数回归模型,则会自动调用summary.rq()来处理这个

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。