资源描述:
《分位数回归。》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、分位数回归三部分:分位数回归简介分位数回归的应用R程序实践一、分位数回归简介为什么要分位数回归?传统的线性回归描述条件均值受自变量的影响,若随机误差满足经典假设,参数估计将具有无偏性、有效性等优良性质。但实际生活假设往往不满足,如存在异方差,偏态分布等会使传统线性回归不具有以上性质。分位数回归1、随机扰动项不做分布的假定,估计具有很强稳健型2、对所有分位数进行回归,这样对异常点具有抗耐性一体两面的,更加精确地描述自变量对因变量变化范围的影响3、分位数回归具有较好的弹性性质4、对于因变量具有单调变换性5、估计参数在大样本下具有渐进优良性为了方
2、便解释清楚分位数回归,先利用一个图形来作简要说明:上图的横坐标表示的是家庭收入,而纵坐标表示的是食物支出。这个例子稍后会用R实现。分位数回归原理回归分析的基本思想就是使样本值与拟合值之间的距离最短,对于Y的一组随机样本,样本均值回归是使误差平方和最小,即样本中位数回归是使误差绝对值之和最小,即样本分位数回归是使加权误差绝对值之和最小,即现假设因变量Y由k个自变量组成的矩阵X线性表示,对于条件均值函数得到参数其中为检查函数,等价于上述加权表述方式。二、分位数回归的应用近10多年来,分位数回归的理论和方法在各个领域中都得到了非常迅速的发展:在环
3、境科学方面,典型的有Chock,Winkler和Chen使用非参数分位数回归法研究了匹兹堡这座城市中日死亡率和空气污染集中度的相互关系;在生存分析方面,Koenker和Hallock(2001)研究了诸多因数对于新生儿出体重的影响。Cole和Green以及Royston和Altman讨论了分位数回归在医学上的应用。Deaton对于分位数回归在需求分析方面上的应用做了介绍,并分析了巴基斯坦的Engel曲线,等等收入不平等问题是分位数回归的另一个研究方面,Gosling、Machin和Meghir研究了英国家庭的收入和财富的分布状况;分位数回归
4、目前在金融方面的应用主要在两个方面。金融资产组合方面:Bassett和Chen运用分位数回归来评估共同基金的投资类型金融风险方面,Taylor使用分位数回归的方法来估计多期收益的风险值VaR。三、R程序实践1、了解包quantreg:包括文档、代码;文档vignette其他文档有crq、rqss文档2、了解线性分位数函数rq()rq(formula,tau=.5,data,subset,weights,na.action,method="br",model=TRUE,contrasts,...)method=:此参数指定用于计算分位数回归的
5、算法1、默认为“br”2、参数设置为“fn”3、参数设置为“fnc”介绍返回值:参数tau决定返回值得对象类型不同。参数tau在01之间返回rq对象;tau在01之外返回rq.process对象3、提取拟合模型信息的方式第一、根据对象类型使用函数对于rq对象,回归系数、残差、效应这些特定模型信息利用对应的通用函数提取,coef(rq)、resid(rq)等,而不是$号提取,这点需要注意。对于Rq.process对象,包括sol和dsol这两种结构,并且必须使用$提取这两种结构成分,成分包括分位数点、参数系数等等第二、利用汇总函数summar
6、y()以及其参数提取信息信息包括估计参数的置信区间和其显著性检验。summary(object,se=NULL,covariance=FALSE,hs=TRUE,...)se:这个参数可以设置为“rank”也是默认设置。假设残差独立同分布。提供估计参数及其置信区间。Se=“iid”假设残差独立同分布。用KB的方法提供参数估计及显著t检验Se=“nid”按照Huber方法得到估计及检验Se=“ker”采用Powell的核估计方法Se=“boot”采用自助法得到估计及检验。covariance=FALSE:是否返回估计系数的协方差矩阵,默认不返
7、回。hs=TRUE:关于带宽的估计方法。分位数回归程序举例:三件事一、作单分位点一般为中位数多分位点的分位数回归拟合并分别提取信息;并制图绘出各分位点的估计参数值,形象说明解释变量是怎样影响各个分位点因变量二、做分位数回归的拟合直线:为直观对比我们绘制了变量散点图;条件均值回归线;中位数回归线;各分位数回归线三、针对缺失值的情况