欢迎来到天天文库
浏览记录
ID:40836341
大小:93.41 KB
页数:21页
时间:2019-08-08
《应用时间序列分位数回归》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、目录一、为什么需要分位数回归二、总体分位数三、样本分位数四、分位数回归的估计方法五、分位数回归模型的估计六、R软件操作分位数回归一、为什么需要分位数回归?1、一般的回归模型着重考察x对y的条件期望E(y
2、x)的影响,如果y
3、x不是对称分布,则E(y
4、x)难以反映条件分布的全貌。如果能够估计条件分布y
5、x的若干重要的条件分位数,比如中位数等,能够更加全面的描述被解释变量条件分布的全貌,而不是仅仅分析被解释变量的条件期望(均值)。不同分位数下的回归系数估计量常常不同,即解释变量对不同水平被解释变量的影响不同。2
6、、使用OLS进行“均值回归”,由于最小化的目标函数为残差平方和,容易受极端值影响。“分位数回归”,使用残差绝对值的加权平均作为最小化的目标函数,不易受极端值影响。而且,分位数回归对误差项并不要求很强的假设条件,因此对于非正态分布而言,分位数回归系数估计量则更加稳健。二、总体分位数假设Y为连续型随机变量,其累积分布函数为Fy(·)。Y的“总体q分位数”,记为yq,满足以下定义式:q=P(Y≤yq)=Fy(yq)£=总体q分位数正好将总体分布分为两部分,其中小于或等于yq的概率为q,而大于yq的概率为(1-q)
7、。如果q=1/2,则为中位数,正好将总体分为两个相等的部分。如果Fy(·)严格单调递增,则有yq=Fy-1(q)对于回归模型,记条件分布y
8、x的累积分布函数为Fy
9、x(·)。条件分布y
10、x的总体q分位数,记为yq,满足以下定义式:q=Fy
11、x(yq)假设Fy
12、x(·)严格单调递增,则有yq=Fy
13、x-1(q)由于条件累积分布函数Fy
14、x(·)依赖于x,故条件分布y
15、x的总体q分位数yq也依赖于x,记为yq(x),称为“条件分位数函数”。对于线性回归模型,如果扰动项满足同方差的假定,或扰动项的异方差形式为乘积
16、形式,则yq(x)是x的线性函数。证明如下:y=x’β+uu=x’α·εε~iid(0,σ2)不失一般性,假设x’α>0。如果x’α为常数,则扰动项u为同方差;反之,则为乘积形式的异方差。根据定义,条件分位数函数yq(x)满足q=P{y≤yq(x)}(条件分位数的定义)=P{x’β+u≤yq(x)}=P{u≤yq(x)–x’β}=P{x’α·ε≤yq(x)–x’β}=P{ε≤(yq(x)–x’β)/(x’α)}=Fε(yq(x)–x’β)/(x’α))其中,Fε(·)为ε的累积分布函数。因此,(yq(x)–
17、x’β)/(x’α)=Fε-1(q)。yq(x)=x’β+x’α*Fε-1(q),故yq(x)是x的线性函数。在同方差的情况下,x’α为常数,所有条件分位数函数{yq(x),018、(2),…,y(n)}。yq等于第[nq]个最小观测值,其中n为样本容量,[nq]表示大于或等于nq而离nq最近的正整数。【例】n=97,q=0.25,则[nq]=[97*0.25]=[24.25]=25。但这种方法不易推广到回归模型。一种等价方法是,将样本分位数看成是某最小化问题的解。样本均值也可看成是最小化残差平方和的解:minui=1nyi-μ2mu=y=1ni=1nyi样本中位数可视为“最小化残差绝对值之和”问题的解:minμi=1nyi-μμ=median{y1,y2,…,yn}为什么求解这个最小19、化问题会得到样本中位数呢?因为只要μ的取值偏离中位数,就会使得残差绝对值之和上升。例考虑一个样本容量为99的样本,假设其样本中位数(即第50个最小观测值)为10。……491050th12……49假设第51个最小观测值为12。如让μ=12而不是10,则对于前50个观测值而言,其残差绝对值yi-μ都将增加2;对于后49个观测值而言,其残差绝对值yi-μ都将减少2。故总变动为(50*2)-(49*2)=2,故第51个最小观测值不如第50个最小观测值(中位数)更能使目标函数最小化。同理,第49个最小观测值也不如第520、0个最小观测值。由此可知,第50个最小观测值(中位数)是最优解。命题可以将样本q分位数视为以下最小化残差绝对值的加权平均问题的最优解:minμi:yi≥μnqyi-μ+i:yi<μn1-qyi-μμ=yq例如果q=1/4,则满足“yi≥μ”条件的观测值只得到1/4的权重,而满足“yi<μ”条件的其余观测值则得到3/4的权重。因为估计的是1/4分位数(位于总体的底部),故较大的观测值得到的权重较小,而较小的观测值得
18、(2),…,y(n)}。yq等于第[nq]个最小观测值,其中n为样本容量,[nq]表示大于或等于nq而离nq最近的正整数。【例】n=97,q=0.25,则[nq]=[97*0.25]=[24.25]=25。但这种方法不易推广到回归模型。一种等价方法是,将样本分位数看成是某最小化问题的解。样本均值也可看成是最小化残差平方和的解:minui=1nyi-μ2mu=y=1ni=1nyi样本中位数可视为“最小化残差绝对值之和”问题的解:minμi=1nyi-μμ=median{y1,y2,…,yn}为什么求解这个最小19、化问题会得到样本中位数呢?因为只要μ的取值偏离中位数,就会使得残差绝对值之和上升。例考虑一个样本容量为99的样本,假设其样本中位数(即第50个最小观测值)为10。……491050th12……49假设第51个最小观测值为12。如让μ=12而不是10,则对于前50个观测值而言,其残差绝对值yi-μ都将增加2;对于后49个观测值而言,其残差绝对值yi-μ都将减少2。故总变动为(50*2)-(49*2)=2,故第51个最小观测值不如第50个最小观测值(中位数)更能使目标函数最小化。同理,第49个最小观测值也不如第520、0个最小观测值。由此可知,第50个最小观测值(中位数)是最优解。命题可以将样本q分位数视为以下最小化残差绝对值的加权平均问题的最优解:minμi:yi≥μnqyi-μ+i:yi<μn1-qyi-μμ=yq例如果q=1/4,则满足“yi≥μ”条件的观测值只得到1/4的权重,而满足“yi<μ”条件的其余观测值则得到3/4的权重。因为估计的是1/4分位数(位于总体的底部),故较大的观测值得到的权重较小,而较小的观测值得
18、(2),…,y(n)}。yq等于第[nq]个最小观测值,其中n为样本容量,[nq]表示大于或等于nq而离nq最近的正整数。【例】n=97,q=0.25,则[nq]=[97*0.25]=[24.25]=25。但这种方法不易推广到回归模型。一种等价方法是,将样本分位数看成是某最小化问题的解。样本均值也可看成是最小化残差平方和的解:minui=1nyi-μ2mu=y=1ni=1nyi样本中位数可视为“最小化残差绝对值之和”问题的解:minμi=1nyi-μμ=median{y1,y2,…,yn}为什么求解这个最小
19、化问题会得到样本中位数呢?因为只要μ的取值偏离中位数,就会使得残差绝对值之和上升。例考虑一个样本容量为99的样本,假设其样本中位数(即第50个最小观测值)为10。……491050th12……49假设第51个最小观测值为12。如让μ=12而不是10,则对于前50个观测值而言,其残差绝对值yi-μ都将增加2;对于后49个观测值而言,其残差绝对值yi-μ都将减少2。故总变动为(50*2)-(49*2)=2,故第51个最小观测值不如第50个最小观测值(中位数)更能使目标函数最小化。同理,第49个最小观测值也不如第5
20、0个最小观测值。由此可知,第50个最小观测值(中位数)是最优解。命题可以将样本q分位数视为以下最小化残差绝对值的加权平均问题的最优解:minμi:yi≥μnqyi-μ+i:yi<μn1-qyi-μμ=yq例如果q=1/4,则满足“yi≥μ”条件的观测值只得到1/4的权重,而满足“yi<μ”条件的其余观测值则得到3/4的权重。因为估计的是1/4分位数(位于总体的底部),故较大的观测值得到的权重较小,而较小的观测值得
此文档下载收益归作者所有