资源描述:
《粗大误差判别准则融合算法探究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、粗大误差判别准则融合算法探究摘要:本文针对工程中对测量值用单一粗大误差判别准则判别精度不高的问题,提出多判别准则融合算法,该算法受多分类器融合思想的启发,主要步骤为首先用遗传算法同时训练各判别准则的权重,然后用各判别准则单独判别粗大误差,最后将各判别准则的判别结果加权平均作为最后的判别结果。算法简单易行,克服了用单一判别算法判别粗大误差精度低的不足,并通过具体实例验证了算法的有效性。在对测量对象进行测量时,由于实验方法和实验设备的不完善,周围环境的影响以及人们认识能力所限等,测量和实验所得数据和被测数据的真值之间,不可避免地存在差异,
2、这个差异就是误差。所谓粗大误差,指的是在超出规定条件预期的误差。粗大误差值较大,明显歪曲测量结果。产生粗大误差的原因是多方面的,大致可归纳为:测量人员的主观原因,这类误差是由于测量工作者工作责任感不强,工作过于疲劳或者缺乏经验操作不当,或者在测量时不小心、不耐心、不仔细等,从而造成了错误的读数或错误的记录,这是产生粗大误差的主要原因;客观外界条件的原因,这类误差是由于测量条件意外改变,比如机械冲击、外界振动等引起的仪器示值或被测对象位置的改变而产生粗大误差。本文讨论了防止和消除粗大误差的一般方法,介绍了基于统计理论的粗大误差判别准则,
3、受多分类器融合算法的启发,提出多粗大误差判别准则融合算法,该算法首先通过测量列集合对每种粗大误差判别准则训练权重,然后将测量列用各判别准则分别判断是否含有粗大误差,最后将各判别准则结果加权平均作为最后的粗大误差判别结果,并通过具体实例验证了算法的有效性。1.防止与消除粗大误差的方法对于粗大误差,除了设法从测量结果中发现和鉴别而加以剔除外,更重要的是加强测量者的工作责任心和以严格的科学态度对待测量工作;除此之外,还要保证测量条件的稳定,或者应避免在外界条件发生激烈变化时进行测量。如果能达到以上要求,一般情况下可以防止粗大误差的产生。在某
4、些情况下,为了及时发现与防止测量值中含有粗大误差,可采取不等精度测量和互相之间进行校核的方法。2.粗大误差判别准则根据具体的应用背景,借鉴统计理论和方法,人们提出了很多判断粗大误差的方法,下面给出了常用的粗大误差判别准则:2.13o准则3c准则也叫莱以特准则,是以发明者的名字命名的,它是最简单的粗大误差判别准则。3。准则是一个近似准则。对于某一测量列,若各测得值只含有随机误差,则根据随机误差的正太分布规律,其残余误差落在±3。以外的概率为0.3%,即在370次测量中只有一次其残余误差落在±3。以外。如果在测量列中发现有大于3。的残余误
5、差测量值,即(1)其中残差是测量值与测量列均值之差,那么则可以认为此测量值含有粗大误差,应该剔除掉。2.2罗曼诺夫斯基准则罗曼诺夫斯基准则又称t检验准则,其特点是首先剔除一个可疑的测量值,然后按t分布检验被剔除的测量值是否含有粗大误差。假设对于某被测量作多次等精度独立测量,得到测量列.如果怀疑测量值含有粗大误差,将其剔除后计算平均值,计算式不包括(2)并求得测量列大的标准差(3)上式中,为测量列的残差。根据测量次数n和选取的显著度a,可通过t分布检验系数表查得t分布的检验系数。如果(4)则可以认为测量列含有粗大误差,剔除是正确的,否则
6、认为不含有粗大误差,应予保留。2.3格罗布斯准则使用格罗布斯准则判定检测结果中粗大误差是一种简单、实用的方法;在实际检测过程中具有很明显的优点,通过相应的准则公式,可以推出那个数值具有较大的误差。1.判别准则融合有些情况下,用不同的粗大误差判别准则判别测量列中的粗大误差,可能会出现不同的判别结果,这就面临选择信任哪种判别准则的问题。在没有先验知识的情况下,选择单一的判别准则来判断是否含有粗大误差,有可能导致错误的判断。如果剔除了不含有粗大误差的数据,会使有用数据丢失,只是浪费珍贵的数据资源;但如果漏检了粗大误差,可能会对最后的测量结果
7、造成严重影响。因此,需要寻找一种方法,综合考虑多种判别准则的判别结果。每种粗大误差判别准则,实际上可以看做是一种数据分类器,即把数据分为好数据和含有粗大误差的数据。在这种思想的指导下,我们可以借鉴多分类器融合的思想,将各种粗大误差判别准则用boosting的方法融合起来。2.实验某工程施工中对一隧道长度用声波技术进行测量,为了提高测量精度,进行了15项等精度测量,得到的15个测量数据分别如下,20.42,20.43,20.40,20.43,20.42,20.43,20.39,20.35,20.40,20.43,20.42,20.41,
8、20.39,20.40,假设经过训练后,3。的准则、罗曼诺夫斯基准则和格罗布斯准则的权重分别为0.2、0.3和0.5,现计算测量列的均值为,第8个测量值偏离均值最严重,因此怀疑此测量值存在粗大误差,接下来分别用3。的准则