欢迎来到天天文库
浏览记录
ID:30957335
大小:65.50 KB
页数:5页
时间:2019-01-04
《一种用于测井数据抗差处理稳健估计算法探究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、一种用于测井数据抗差处理稳健估计算法探究摘要:为了科学的还原井眼的轨迹,实现井眼轨迹测量精度的提高,我们一般采用稳健估计的思想来进行测井数据的抗差处理。本文主要以四种主要的基于选权迭代法的函数为例,通过理论的分析以及实际的计算,对四种计算法进行了分析和研究,得出了进行测井数据抗差处理的最佳方案,同时也为其它类型数据的测量工作提供了参考。关键词:稳健估计;选权迭代法;数据处理;抗差计算中图分类号:P631.84文献标识码:A文章编号:1006-6675(2013)15-油井测斜工作中,最有效的实现井眼轨迹复现的方式,就是进行井眼轨迹位置参数的描述和确定。当然要想使井眼轨迹的立体形象被描
2、述的更加精确,就需要数据的支持。但是在进行测量的时候会发现,井下环境存在着很多的不确定和干扰因素,例如传感器的突然活动等,会导致一些不合理的跳点出现在测量的数据中,也就是野值或者粗差。这样的实测数据可信度有限,并且通过一系列的后续计算后可能会对处理结果造成很大的影响,甚至导致错误结果的出现。所以,对于测量数据的确认、排除和修正就显得尤为重要。、稳健估计原理测量中粗差的情况是不可避免的,针对这样的情况我们采用稳健估计的办法,也就是测量中所说的抗差估计,它是根据最小二乘法在抗粗差干扰方面表现最差的情况提出的,通过适当的估计方法的选用,来获得受粗差影响最小的未知量估计值,进而获得最优的抗差
3、值。其中,对有效信息实现充分的利用是抗差估计的基本原则,对错误信息实行剔除政策。但是,因为在进行计算之前,我们并不能够明确的分辨出的数据中的有害信息和有效信息,同时对于两种信息在信息中的分布位置以及比重也不清楚。所以在进行抗差估计的时候,我们要牢记主要的目标,忽视效率损失的风险,力争获得有效的、可靠的、更具实际意义的估值。因为井测数据一般是具有时间性的序列,所以通过偏最小二乘法、卡尔曼滤波等方法可以进行下一个观测值口的预测,同时粗差可以应用求取残差的办法来进行识别。但是这种方法需要动力学方程的建立作为支持,并且数据计算的复杂程度较高,在预处理测量数据的阶段并不十分适用。针对这些问题,
4、稳健估计的思想更加的适用,在通过光纤陀螺的惯性技术测斜仪所得到的井眼轨迹数据的基础上,可以通过IGG法、Hampel法、Huber法、丹麦法等几种主要的迭代方式来进行抗差处理。二、选权迭代法研究选择出能够达到稳健性需要的函数,再利用相关的函数公式就能够进行估算参数的计算了,这个估算的过程有很多实现的办法,特别是在测量平差中的使用最为普遍,选权迭代法是实现程序的最简便方式。在迭代的过程中能够发现,随着函数的取值变化,权函数存在多种不同的形式,但是权函数的变化范围总是维持在一个平差过程中。多次的迭代之后,如果某个观测值具有粗差,那么它的权函数值会变成或者接近零,使它在平差中失去作用,并进
5、一步在变权中使参数估计的稳定性得到保证。(一)几种常见的选权迭代法常见的选权迭代法函数有Huber函数、IGG函数、丹麦函数、Hampel函数,这几种权函数的特点非常相近,都是将其取值划分为几个区间,再依照不同的自变量取值来进行所占权重的判断。其中,区间的划分办法会对权函数的数据处理成果以及适用范围造成影响。Huber权函数比较单调,有可疑域以及正常域两部分组成,对于正常域,通过最小二乘法来进行观测值的估计,其它观测值全部进行降权处理,一旦改正数大于正常域的临界值,因为所占的权重与它是反比的关系,所以误差就会更大,同样的道理,观测值对应的权重越小,其对估计的影响也就越小。同Huber
6、权函数相近,丹麦权函数也包含可疑域和正常域两部分,也以最小二乘估计法来进行正常域数值的计算,其它观测值进行降权,但是,指数性变化是其降权函数的特点。IGG权函数的提出是针对测量误差的有界性,是一种有效的抗差估计的方式。区别于前两种方式,它还具有淘汰域。这种方式会依据工程数据的特殊性,决定所采用的阈值范围,通过直接剔除误差较大的异常值来提高计算的效率。Hampe权函数与上述函数都不相同,它在测量数据三个域划分的基础上,又将可疑域一分为二,采用多范围的方式对可疑域的权重进行调整,增加了其稳定性,但是由于迭代次数增加会对计算效率造成一定的影响。(二)抗差能力的评估临界值的选取在选权迭代法进
7、行抗差评估的过程中非常重要,它的合理性不仅关系到平差的效果,还直接影响着平差工作的开展情况,所以要根据使用方法的不同进行临界点的选择。在VC环境下,数据的抗差计算可以在MFC平台下进行编制。第一步,进行数据迭代步长的确定以及更新。要进行数据处理容量的限制,同时为了使初始信息的准确性得到保证,应该最少选用50个起始数据。第二步,进行权函数的选择,按照选用权函数的不同进行不同量的计算,在每次的迭代中进行对应数据权重的更新。第三步,对迭代收敛原则进行设定。根据实
此文档下载收益归作者所有