剔除测量数据中异常值的若干方法

剔除测量数据中异常值的若干方法

ID:42032787

大小:243.32 KB

页数:4页

时间:2019-09-05

剔除测量数据中异常值的若干方法_第1页
剔除测量数据中异常值的若干方法_第2页
剔除测量数据中异常值的若干方法_第3页
剔除测量数据中异常值的若干方法_第4页
资源描述:

《剔除测量数据中异常值的若干方法》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第卷第期航空计测技术年月叉〕衣误差与分析易叮除测量数据中异常值的若干方法卞何平中科院高能所,北京市,介绍了判别测量值异常值的种常用方,给出了实用程序,并结合实例说明了上述方法文摘法的具体应用。关钮词测量数据异常值判别方法应用,团,,,,判别,依据如下假设符合正态分布即测量列也服从概述正态分布,数据测量系统常因干扰使正确数据产生偏离这。,则‘为粗大误,一差应予舍弃些偏离数据会给后续分析带来很多麻烦,甚至严重后‘。,,,。。,,一毛则为正常数据应予保留果对于这种数据应尽可能分析检查其出现的原因,,。根据概率论统计当误差服从正

2、态分布时误差大以便取舍数据有更加充分的依据但有时不能找到出,于。,,,的观测数据出现的概率小于即在大于现的原因此时既不能轻易地保留也不能随意地舍。,,次的观测中才有出现次的可能因此若采用莱因达弃而应对其进行统计检验以便从统计规律上判明数,。准则亦称准则进行粗差剔除时置弃概率是较据是否为异常值如果主观地将本来不是异常值的测。,,小的这样有时就会将不合理的异常值也予以保留量值舍去表面上测量精度提高了但实际上这是虚假。一格拉布斯准则的结果因而,探索实用的解决办法对物理量的计量测。。假设测量列为正态分布把测试得到的数据按其试具有

3、很大的实用价值下面分别介绍几种进行异常,,。大小从小到大排列总是先怀疑最小或最大的数据是值判别的统计学分析方法。异常的具体步骤如下。异常值的判别方法选定危险率计算值为顺序统计量的分布。判别异常值数据的准则常用的有莱因达准则、格。拉布斯准则、狄克逊准则、肖维勒准则等等,以下分别设是可疑的令一一。,〔。简要介绍设是可一一。疑的令莱因达准则、,。,、,,式中艺护一乙一,。,甘里对于采集几个数据的测量列⋯先求一一‘一一,得算术平均值艺及剩余误差然,一一一一,收稿收修改稿。。后再根据贝塞尔法求得均方根偏差一艺讨一卞岁男工程师航空计

4、测技术第巧卷,,。。,。查表中相应于及的值予舍弃这样的判决犯错误的概率为若,,,。设妻的则所怀疑的数据是异常的应,,则还不能以危险率将此数据弃去表,相应的,值为为为狄克逊准则,、、的波动记录分别用莱因达准则格拉布斯准则狄二,若有组测量数据毛簇且为正态分,⋯克逊准则及肖维勒准则进行粗大误差的检验判断是,则可能为异常值的测量数据必然出现在两端,即戈。布否有异常值存在。。。或分别使用不同的统计量见表当求得统计莱因达准则应用软件流程图及实例量大于表相应置信度一和测量次数的临界值首先计算测量数据的算术平均值,,。时则可将被检测的数

5、值作为异常值舍去名,一、表不同范围的极差比口计算测量数据的剩余误差及均方差了,检验检验‘劝一名矛一丈,江。一,,一。一二一。一一根据莱因达准则剔除坏值,一一,了一。一。二一二产,一一毛一一而‘、,。,,,。蕊,落了、一。一,。一。,一由于一川则为异常值应予舍弃程序框。图如图所示,,,一一。。。一了一一格拉布斯准则应用软件流程图及实例。一及。首先选定危险率计算均方差计算值设,是可疑的肖维勒准则。’肖维勒准则也是假设多次一一‘一以正态分布为前提的,重复测量所得个测量值中某数据的残余误差一。,。。。,,。又则剔除此数据一艺洲一

6、实用中由查表中相应的值为,于是样品容量为时的判别系数,所以这根据格拉布斯准则检测表中的数据由于,,,。在一定程度上弥补了莱因达准则的不足,相则数据是异常的应予舍弃程序对莱因达。准则而言,这一判别准则要苛刻得多。。与的关系框图如图所示由表给出狄克逊准则应用软件流程图及实例对于表中数据,因,根据表用姚式实用程序及应用举例一一,,一,表给出组测量数据恒温室对标准温度一一一、第期何平剔除测量数据中异常值的若干方法,相应的,表艺值“。。·。、表与值的对应关系乙,表组测量数据已按顺序从小到大排好查表得戈,。。,根据。到临界值也都有其

7、局限性例如所有的准则都是以数据按正态狄克逊准,,,故,,,则由于孔戈值是异常分布为前提的当偏离正态分布时判断的可靠性将受,。。值应予舍弃影响还有几个准则对值的要求也各有不同当大样。程序框图如图所示本,,测定时使用莱因达准则最适合但当小样本测定肖维勒准则应用软件流程图及实例时,则一般推荐使用格拉布斯准则和狄克逊准则。而肖计算算术平均值一·维勒准则在某种程度上讲仅仅是莱因达准则的补充。,计算剩余误差,及均方差。在实际测量中,一般取测量次数一一次,特。,,。,从表中查得相应的值一故一别精密的测量也很少超过一次因此使用,。根据肖

8、维勒准,以上各种准则时必须注意测量次数的限制对于莱因则检测是否为异常值,,一达准则一般建议测量次数大于或等于次而对于,而‘舟格拉布斯准则和狄克逊准则则建议小于或等于次。但这一区别并不是十分严格的。,,,。一及。由于则值异常应予舍弃程序框图,对小样本来说由于格拉布斯准则能给出较严格如图所示。,狄克逊准则。,,且的结果无

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。