资源描述:
《动态测量数据的抗扰性分析研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、11卷第3期数理统计与应用概率Vol.11,No.31996年9月MathematicalStatisticsandAppliedProbabilitySep.19963动态测量数据的抗扰性分析研究范金城胡 峰(西安交通大学理学院,西安,710049)(西安卫星测控中心,西安,710043)摘 要 本文,从异常值的识别与滤波算法的抗扰性分析等方面,总结了动态测量数据的抗扰性处理技术的研究现状.1 引 言本文所谓的抗扰性(resistance),是指数据处理方法对采样数据及处理模型的微小扰动的不敏感性,它是统计决策的稳健
2、性(robustness)理论在工程数据的探索性分析与高精[2]度处理中应用的体现.换句话说,稳健性是抗扰性的概率表征.抗扰性的研究工作最早见于Mosteller和Tukey(1977)及其所引用的文献中.Huber(1981)对抗扰性给出了如下的描述性定义:“一个有限样本估计泛函Tn,如果数据的微小变动仅能导致估计泛函Tn的微小改变,我们则称它为抗扰的”.当然,Huber(1981)的这一定义主要是从统计学角度提出的,它未能反映模型的微小改变对估计量的影响.其实,在工程统计与过程控制中,经常会出现如下三种类型的“微小改
3、变”:(1)由于信号记录设备的故障、操作人员的过失或其他原因,采样数据的集合中往往含有少量的异常值(outliers).也就是说,在采样序列中,出现小部分样本点明显偏离大部分数据所呈现的趋势;(2)由于信号记录设备精度的限制与记录时舍入误差的影响,采样点列的数据大小只是目标真实状态的一组近似.即,大部分观测值都包含有微小的误差;(3)对工程数据进行处理时,总是对目标的运动状态进行一些简化与模型假定.但是,假定的理想化模型通常只是目标运行轨迹的一个近似描述.简单地说,情况(1)反映的是“小部分数据的巨大改变”,情况(2)反
4、映的是“大部分数据的微小变动”,而(3)则反映的是模型设计可能出现的“微小扰动”.抗扰性研究,主要分析各种工程信号处理方法对数据的微小扰动(包括情形(1)、(2))及对模型的微小扰动(情形(3))的敏感性,并构造出具有良好抗扰性能的、易于工程实现的新的数据处理程序.3 收稿日期:94年9月27日.收到修改稿日期:94年12月13日.©1995-2004TsinghuaTongfangOpticalDiscCo.,Ltd.Allrightsreserved.第11卷第3期范金城等:动态测量数据的抗扰性分析研究245本文,将
5、从动态测量数据序列的异常样本点识别方法、抗扰法滤波方法和抗扰性能的评价体系等方面,对工程数据处理的抗扰性研究的发展作一简单回顾.2 异常值识别方法的研究与发展[19]异常值的定义一直不很明确,不同的学者给其赋予的内涵也不尽相同.最初,Edgeworth(1887)认为,异常值是“显然严重偏离了样本集合中其它观测值的观[20]测值”.这个纯主观的基于数据的定义,对于简单随机抽样或可重复抽样的样本点的异常性描述是十分合适的.文[21]基于这种定义,从工程应用的角度综述了可重复抽样情况下异常值识别技术的发展状况,及工程实现时的
6、一些问题.Edgeworth的关于异常值的定义影响了近一个世纪,直到本世纪70年代仍被采用.Künsch(1984)从时间序列分析的稳健化研究出发,首次提出了异常数据的生成模型,讨论了AO模型与IO模型下异常值的特点,并将动态测量数据集合中的异常值分为[11]孤立型异常值、相依型异常值和异常值斑点三大类.通过参考Künsch(1984)对异常值生成模型的合理描述,并充分吸收Edgeworth(1887)定义、文[3]定义的优点,文[19]从工程信号处理的实际出发,建议采用异常数据的定义为:“集合Dn中严重偏离大部分数据所
7、呈现趋势的小部分数据点.”本定义强调主体数据所呈现的趋势,以此为判别异常数据的指标,并明确指出异常数据在集合Dn中只占小部分(即最多不超过一半),这从直观上也是合理的.本定义不但可以覆盖简单随机抽样情形,包括了Edgeworth(1887)的定义,而且还覆盖了动态测量数据序列及随机系统中的异常数据情形.对于“异常值的识别方法”这一与工程应用密切相关的统计学课题,历史上曾有众多的统计学者(例如,Barnett和Lewis(1978),Anscombe(1960),Grubs(1969),Rousseeuw(1987),Ka
8、le(1970)及[5]等)从回归分析、方差分析、试验设计、影响分析及数据变换等多方面对之做了大量的探索与研究.Huber(1964,1981)、Hample,et.al(1987)与Künsch(1984)等则从尽量减小数据与模型的微小扰动对统计决策不利影响的角度,提出和发展了稳健统计、稳健信号处理和稳健随机控制理