欢迎来到天天文库
浏览记录
ID:56949344
大小:219.80 KB
页数:11页
时间:2020-07-28
《行业标准:GB 8056-1987 数据的统计处理和解释 指数样本异常值的判断和处理.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、中华人民共和国国家标准UDC引9.28数据的统计处理和解释GB8056一87指数样本异常值的判断和处理StatisticalinterpretationofdataDetectionandhandlingofoutlyingobservationsinexponentialsample1目的和应用范围1.1本标准规定r在来自指数分布(单参数)的随机样木中判断和处理异常观测值的一般原则和实施方法。适用于来自指数总体或近似指数总体的样本,即除了个别或少数异常值外,其余大部分数据(主体数据)来自同一个指数总体或近似指数总体。指数分布的分布函数为
2、:1一e一^1X>0(1)尸(X)二{0X‘U概率密度函数为元e‘,(X)={X'>9..................·⋯⋯〔2)0X、_u1.2异常观测值(或称异常值)是指样木‘11的个别值,其数值明显偏离它(或它们)所在样本的其余观测值。1.2.1ii'常值可能仅仅是数据‘{,】州有的随机变异性的极端表现,若确是这样,就应把它和样木,},其它观测值以同样的方式对待。1.2.2异常值也可能是偶然偏离所规定的试验条件和试验方法的后果。或是在计算或记录这个数值时出现的失误。这种异常俏与其它观测值不属]同一个总休。2引用标准GB3358-
3、82《统计学名词及符号》GB4086.1一4086.6-83(统计分布数值表》3符号及其意义X()—观测值}j,自小到大的第f个观测仇。n(刀〕—样本大小,4a10。时,检验最大的观测值X(.)是否为异常值时所用的统计量。”(飞)一一样本大小。叹1000寸,检验最小的观测值X(1)是否为异常值时所用的统计量。”(”)—样木大小n>100时,检验最大的观测值刃(。。是否为异常值时所用的统计鼠。万nt飞)样本大小。>100时,检验最小的观测值X(1〕是否为异常值时所用的统计Moa检验的显著性水平。T=。)(1一a)-显著性水平为a时,用统计量
4、7’。(。)作检验时的临界值。71}〔:〕(a)显著性水平为a时,用统计量7':u)作检验时的临界值。衬。(v,,v2)自由度为u不口。2的F变星的p分位数。六,.〔卫定数截尾样本.},判断h〔1是否为异常小时所用的统计v%o国家标准局1987一07一08批准1988一04一01实施GB8056一87‘判断异常值的统计学原则判断一个观测值是否为异常值时,通常可根据技术卜或物理L的理由ki接作出决定,例如当实脸者已经知道实验偏离规定的实验方法,或测试仪器发生问题等等。当上述理由不明确时,可用统计方法。4.1木标准在F述不同情祝下判断样本‘}
5、,的异常值:单侧情形a):根据以往经验,异常值都为佰端值;单侧情形b):根据以千}经验,异常值都为低端值;双侧中韶(s.异常俏是在两端都可能出现的极端值。4.2执行本标准时,应规定在样本中检出异常值的个数的卜限(占样木观测值个数的较小比例),当超过了这个卜限时,对此样本的代表性,应作慎重的研究和处理。4.3判断单个异常值的检验规则4.3.1将所有观测值假设为来自同一总体的样本诸们,作为原假设;选定与实际情说相符的4.1中的一种情况作为备择假没,而后根据统计学原理构造判断异常值的统计量。4.3.2指定适当的显著性水平a,推荐的a值为1%,而
6、不宜采用超过5%的a值。根据a及观测值的个数。,确定统计4k的临界位。4.3.3将该批数据代人统计u,所得统计io的俏超过临界值时,则判断事先待查的极端观测值为异常;否则就判断没有异常值。4.4判断多个异常值的检验规则在允许检出异常Tk`1的个数可大于1的情Ik,本标准规定的方法是重复使用同一种判断单个异常俏的检验规则,即用指定的显著性水平和符合4.3规定的检验规则检验全体观测值,若没有检出异常俏,则铭个检验停11:;若检出了1个异常值,就再用相同的显著性水平和相同的规则,对除去已检出的异常值后余下的观测值继续检验,直到没有检出异常值,或
7、检出的异常值个数达到仁限为止。5处理异常值的一般规则5.1对卜用统计方法检出的异常值,应尽可能寻找其技术上的和物理上的原因,作为处理异常值的依据。5.2处理异常值的方式有:a.异常值保留在样本中参加其后的数据分析。b.允许剔除异常值,即把异常值从样本iti排除;c.允许剔除异常值,并追加适宜的观测值计人样本。d.在找到实际原因时修正异常值。5.3标准使用者应根据实际问题的性质,权衡寻找产生异常值原因的花费,正确判断异常值的得益及错误剔除正常观测fk5的风险,确定实施下述几个规则中的一个:a.对O召可异常值,若无充分的技术上或物理上的原因,
8、则不得剔除或进行修,[几。‘.异常1All,除有充分的技术上或物理L的理由者外,在统计仁表现为高度异常的(即本标准规定的显著性水平a下,为显著的观测值),才允许剔除或进行修正。5.4被剔除或经
此文档下载收益归作者所有