分位数回归及应用简介.pdf

分位数回归及应用简介.pdf

ID:57300962

大小:166.17 KB

页数:5页

时间:2020-08-10

分位数回归及应用简介.pdf_第1页
分位数回归及应用简介.pdf_第2页
分位数回归及应用简介.pdf_第3页
分位数回归及应用简介.pdf_第4页
分位数回归及应用简介.pdf_第5页
资源描述:

《分位数回归及应用简介.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第21卷第3期统计与信息论坛Vol.21No.32006年5月May,2006===============================================================【统计理论与方法】分位数回归及应用简介李育安1,2(1.中国人民武装警察部队学院,河北廊坊065000;2.中国人民大学统计学院,北京100872)摘要:文章介绍了分位数回归法的概念、算法及主流统计软件R和SAS计算时的语法,并通过实例与以普通最小二乘法为基础的线性回归进行了对比,展现了分位数回归的巨大魅力。关

2、键词:最小二乘法;分位数回归;恩格尔曲线中图分类号:O212.1文献标识码:A文章编号:1007-3116(2006)03-0035-05假设,那么在应用时就难以得到无偏的、有效的参数一、引言估计量。还有,大量的宝贵数据仅仅只能得到一条1870年,英国的高尔顿在研究人类身高的遗传回归曲线,而一条曲线所能提供的信息毕竟是有限规律时发现:父母是高个子的,其子女的身高有低于的。所以人们在使用回归分析时,也在不断地探索父母身高的趋势;相反,父母是矮个子的,其子女的更新更好的方法,而条件更宽松,挖掘信息更丰富身高却往往有

3、高于父母身高的趋势。从全局来看,者,当属分位数回归。高、矮个子人的子女都有“回归”于一般人身高的期自从Koenker和Bassett(1978)[1]最早提出线性望值。这就是统计学上“回归”的最初涵义。1886分位数回归的理论以后,当时由于分位数回归本身年,高尔顿在论文中正式提出了“回归”的概念。经计算的复杂性,所以它没能象经典的回归分析那样过他的学生皮尔逊多年的进一步的发展后,这个出迅速普及,但对它的理论研究一直在不断的完善中。自于生物统计学领域的概念,便被推广为一般统计随着计算机技术的不断突破,分位数回归软

4、件包现方法论的重要概念。已是主流统计软件R、SAS等中的座上客了,分位数“回归分析”悠久的历史,使其理论完美,计算工回归也就自然而然地成为经济、医学、教育等领域的具齐全,这其中又以基于最小二乘法的经典线性回常用分析工具。归在数据分析中遍地开花。原因不外是最小二乘法二、分位数回归的概念、性质的解释与人们的直观想象一致;同时该方法易于计算,有时计算用手工,其优越性在前计算机时代是不对于任意实值随机变量Y,它的所有性质都可言而喻的。尤其是当假设误差是正态分布时,它具以由Y的分布函数,即:有如无偏性与有效等优良性质;但

5、是运用最小二乘F(y)EPr(Y≤y)法的条件比较高,如线性回归模型要求满足同方差来刻画。对于任意的0<τ<1,定义随机变量Y的性、随机误差间两两不相关等条件,当需要进行回归τ分位数函数Q(τ)为:系数的显著性推断时,通常还要假设残差服从正态Q(τ)Einf{y:F(y)≥τ}(1)分布。尤其是当分布是重尾或有离群点时,其结果它完全刻画了随机变量Y的性质,可以看出[注意:的稳健性较差。在实际问题中,完全满足这些基本与F-1(τ)E{y:F(y)≥τ}进行比较],存在比例假设的情况并不多见,然而一旦违背了某一项基

6、本为τ的部分小于分位数函数Q(τ),而比例为1-τ收稿日期:2005-09-09基金项目:国家自然科学基金(10431010);教育部重点基地重大项目(05JJD910001);中国人民大学应用统计中心资助。作者简介:李育安(1969-),男,湖北省大悟人,副教授,博士,研究方向:复杂数据的统计建模。35统计与信息论坛的部分位于分位数函数Q(τ)之上。三、样本的线性分位回归对于任意的0<τ<1,定义“检验函数”(u)为:对于随机变量Y的一个随机样本{y,y,y,pτ123pτ(u)E(τ-I(u<0))u⋯,y

7、n},它的中位数线性回归就是求解使下面的绝对值偏差和为:τuu≥0E{(2)(τ-1)uu<0minζ∑

8、yi-ζ

9、其中I(u<0)为示性函数,由“检验函数”定义(式2)中位数线性回归其实是分位数线性回归的一个特例或图1(注意:同线性方程yEkx比较,τ相当于直(τE1/2),它在分位数线性回归中占有相当重要线的斜率k)。可以看出,“检验函数”是分段函数,且的地位,对它的研究可追溯到18世纪中叶的(u)≥0。pτBoscovich研究地球椭圆率时。19世纪Edgeworth对此有所发展,但之后则陷入了计算泥潭,

10、太多的未知数、太多的超平面。直到20世纪40年代末,线性规划中单纯形法的出现,中位数线性回归才得以在实践中大显身手。而τ分位数的样本分位数线性回归则是求满足:min∑pτ(yi-x◜iβ(τ))kβ∈R-i图1“检验函数”p(u)示意图的解β(τ),它的展开式为:τ为积分方便,“检验函数”(u)可改写成:min[τ

11、yx◜(τ)

12、+pτk∑i-iββ(τ)∈R(i:y≥x◜(τ))p(

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。