欢迎来到天天文库
浏览记录
ID:59767274
大小:11.69 MB
页数:44页
时间:2020-11-23
《稳健回归2013版ppt课件.pptx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、稳健估计主要内容一、稳健估计的概念及任务二、重要背景三、线性模型的稳健回归1一、稳健估计的概念及任务估计的稳健性(Robustness)概念指的是在估计过程中产生的估计量对模型误差的不敏感性。因此稳健估计是在比较宽的资料范围内产生的优良估计。如在独立同分布正态误差的线性模型中,最小二乘估计(LSE)是有效无偏估计。然而当误差是非正态分布时,LSE不一定是最有效的。但误差分布事先不一定知道,故有必要考虑稳健回归的问题。一般认为对一个估计量进行评价时,需要考虑两种类型的稳健性:效度稳健性和效率稳健性。分别满足一下两个条件:1、数据的微小改动不会造成估
2、计的剧烈变化。2、在各种情况下该估计都具有高效率。我们主要关注效度稳健性,因为对一个稳健估计量来讲,效率稳健性一般只被看作第二位的标准。2模型误差实际模型与所建模型之差称为模型误差。模型误差分为随机误差、系统误差和粗差。粗差粗差是指在相同观测条件下作一系列的观测,其绝对值超过限差的测量偏差。它产生的最普遍原因是观测时的仪器精度达不到要求、技术规格的设计和观测程序不合理,以及观测者粗心大意和仪器故障或技术上的疏忽等。31、概念所谓稳健估计,是在粗差不可避免的情况下,选择适当的估计方法,使所估参数尽可能减免粗差的影响,得出正常模式下最佳或接近最佳的估
3、值。在《现代稳健回归方法》中,稳健回归被宽泛的定义为任何限制特异值对回归估计造成过分影响的回归。稳健估计与经典估计理论的根本区别在于前者是把稳健估计理论建立在符合于观测数据的实际分布模式而不是像后者那样建立在某种理想的分布模式上。42、稳健估计的原理稳健估计的原则是要充分利用观测数据(或样本)中的有效信息,限制利用可用信息,排除有害信息。由于事先不大准确知道观测数据中有效信息和有害信息所占比例以及它们具体包含在哪些观测中,它可以用来探测离群值和提供抵抗误差的结果,因此要冒损失一些效率的风险,去获得较可靠的、具有实际意义的、较有效的估值。53、目标
4、(1)在采用假定模型下,所估计的参数应具有最优或接近最优性;(2)如果实际模型与假定模型存在较小的偏差,则对应的估计参数所受影响也较小;(3)即使实际模型与假定模型有较大的偏差,其参数估值的性能也不应太差,亦即不至于对估值产生灾难性的后果。6二、重要背景782、崩溃点/失效点崩溃点(BDP)是一种估计量的抗异常值干扰能力的全局性测度。准确的讲,它是一个估计量在不产生任意结果的前提下能够容忍的离群案例的最小分量或百分比。假定所有的可能“破败”的样本,其中m个观察案例被替换为任意值(即不符合数据一般趋势的观察案例),为,那么由这种替换所可能造成的最大
5、影响是:91011121314151617181920212223各种估计量的对比例124例2252627三、线性模型的稳健回归28293031323334迭加再加权最小二乘法求解回归的M估计必须使用迭代程序,因为残差在建立模型之前根本不可能知道,而估计结果在不知道残差之前也求不出来。因此迭代再加权最小二乘法被用来解决这一问题。3536373839407、MM估计估计量是目前使用最多的稳健回归技术。他们同时具有高崩溃点(50%)和良好的效率(高斯-马科夫假定下,效率约为OLS估计的95%)。名称中的“MM”指的是这种估计使用了一个以上的M估计程序
6、来计算最终的估计。与M估计的情况一样,迭代再加权最小二乘法被用来求解最终估计。程序如下:41428、各种统计量的比较43同样,以预测公众态度的多元回归为例,得到如下结果44
此文档下载收益归作者所有