欢迎来到天天文库
浏览记录
ID:28202065
大小:55.50 KB
页数:6页
时间:2018-12-08
《水质分析过程可疑数据的几种处理方法及注意问题》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、水质分析过程可疑数据的几种处理方法及注意问题摘要:在水质分析时,经常会存在一些可疑值,对可疑数据处理常用方法有:拉依迗法、Dixon法、Grubbs法。文章对这三种方法的计算方法,使用条件,方法优点以及多个可疑值出现时的处理问题做出探讨。关键词:可疑值;3s法;Dixon法;Grubbs法在水质分析时,异常值可能是因为各种随机误差的影响,也有可能因为其他因素。对可疑值的处理,可通过一些方法进行统计检测。本文列出了三种方法,下面对这三种方法分别做出讨论。1拉依迗法由于该方法是以3倍标准偏差作为判别标准,所以亦
2、称3倍标准偏差法,简称3S法。适用条件:当测量数据较多时,且成正态分布时可选用此方法。检验方法:检测公式
3、x-xd
4、〉3S(1)X:样本平均数xd:可疑数据S:样本标准偏差,若xd满足(1)式,则为离群值,应舍去。取3S的理由:根据随机变量的正态分布规律,在多次试验中,测量值落在xd_3S与xd+3S之间的概率为99.73%,出现在此范围之外的概率仅为0.27%,也就是在近400次试验中才能遇到一次,这种事件为小概率事件,出现的可能性很小,几乎是不可能。因而在实际试验中,一旦出现,就认为该测量数据是不可靠的
5、,应将其舍弃。另外,当测量值与平均值之差大于2倍标准偏差(即x-xd
6、〉2S)时,则该测量值应保留,但需存疑。方法优点:拉依达法简单方便,不需查表,但要求较宽,当试验检测次数较多或要求不高时可以应用,当试验检测次数较少时(如nQO.01,则可疑值为离群值。方法优点:相对比较严密,对一组数据中只有一个可疑值存在时较为适用。注意问题:用该方法剔除一个可疑值时,若剩余数据还有可疑值存在,经过检验又被剔除,则说明该方法对此组数据检验存在误差,不能再使用此方法,可使用Grubbs法。表1Dixon检验法计算公式和临界
7、值Qn表样本数n统计计算公式显著性水平(a)检验最小异常值检验最大异常值0.100.050.019410.9880.8890.7800.6983QQ0.886040.6790.76550.5570.64230.4820.56040.4340.5070.6375QQ0.5790.5540.68360.4410.5120.63570.4090.4470.5978QQ0.5170.5760.67990.4900.5460.642100.4670.5210.61511QQ0.4920.5460.641120.472
8、0.5250.616200.4010.4500.535250.3600.4060.4893Grubbs法使用条件:用于多组测量值均值的一致性和剔除多组测量值中的离群均值,也可以用于检验一组测量值的一致性和剔除一组测量值中的离群值。检测方法:对L组测量值,将每组n个测量值的均值记为xl〈x2〈…9、0.01,则为离群均值。表2Grubbs检验临界值(Ta)表L显著性水平aL显著性水平aL显著性水平a0.050.010.050.010.050.0131.1531.115112.2342.485192.5322.85441.4631.492122.2582.050202.5572.88451.6721.749132.3312.607212.5802.91261.8221.944142.3712.695222.6032.93971.9382.097152.4092.705232.6242.96382.03210、2.221162.4432.747242.6442.98792.1102.322172.4752.785252.6633.009102.1762.410182.5042.821方法优点:较Dixon法更为严密,能对一组数据中多个可疑值进行检测,可进行多次可疑数据的剔除,提高数据处理的准确度。注意问题:当可疑数据有两个或两个以上时,且均匀分布在同一侧(即为xl,x2或xL-1,xL)此时在检测时,要先检测靠近的可疑值(即为x2或xL-l),然后通过计算T=来检验x2是否舍去,若x2离群,则xl必然离群,应当注11、意的是此时总均值=,不包括x2。同理检验xL-1,即T=,此时=,然后对照T值表,检验xL-1是否离群,若xL-1离群,则xL必然离群。当可疑数据在总均值两侧时,要先检验离均值远的可以数据,若剔除了一个数据,在检验下一个时,此时总均值的求解为剩余L-1个均值的算术平均值。通过这三种方法,我们可以在水质分析数据处理过程中提高我们检测结果的准确度,从而相对客观的反映水质情况,为水质鉴定,水污染防治提供可信资料。参考文
9、0.01,则为离群均值。表2Grubbs检验临界值(Ta)表L显著性水平aL显著性水平aL显著性水平a0.050.010.050.010.050.0131.1531.115112.2342.485192.5322.85441.4631.492122.2582.050202.5572.88451.6721.749132.3312.607212.5802.91261.8221.944142.3712.695222.6032.93971.9382.097152.4092.705232.6242.96382.032
10、2.221162.4432.747242.6442.98792.1102.322172.4752.785252.6633.009102.1762.410182.5042.821方法优点:较Dixon法更为严密,能对一组数据中多个可疑值进行检测,可进行多次可疑数据的剔除,提高数据处理的准确度。注意问题:当可疑数据有两个或两个以上时,且均匀分布在同一侧(即为xl,x2或xL-1,xL)此时在检测时,要先检测靠近的可疑值(即为x2或xL-l),然后通过计算T=来检验x2是否舍去,若x2离群,则xl必然离群,应当注
11、意的是此时总均值=,不包括x2。同理检验xL-1,即T=,此时=,然后对照T值表,检验xL-1是否离群,若xL-1离群,则xL必然离群。当可疑数据在总均值两侧时,要先检验离均值远的可以数据,若剔除了一个数据,在检验下一个时,此时总均值的求解为剩余L-1个均值的算术平均值。通过这三种方法,我们可以在水质分析数据处理过程中提高我们检测结果的准确度,从而相对客观的反映水质情况,为水质鉴定,水污染防治提供可信资料。参考文
此文档下载收益归作者所有