资源描述:
《基于偏最小二乘回归的油田产量预测》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于偏最小二乘回归的油田产量预测11211董玉才,李红燕,朱连军,鞠桂玲,王素云(1.装甲兵工程学院非线性研究所,北京100072;2.装甲兵工程学院科研部研究所,北京100072)摘要:为了预测油田的动态产量,综合考虑影响油田产量的各种因素,建立了油田产量的偏最小二乘回归模型,通过精度分析,回归模型能概括原始数据所携带大部分的信息,通过对比,证明该模型预测效果好,预测结果更准确。关键词:油田产量;偏最小二乘回归;预测在油田生产过程中,对油田原油产量的准确预测是油田生产计划管理的一项重要研究任务,原油产量是计划管理的主要目标,因此,能否准确预测原油产量对生产计
2、划管理就显得格外重要。影响油田产量的因素很多。一些学者从油藏工程的角度出发,对油田的产量预测方法进行了研究,目前,预测油田产量的[1][2-3][4]方法主要有注采关系法模型、产量递减模型和Logistic模型,文献建立了多变量回归模型进行了预[5]测,文献利用“后推法”筛选变量,使得到的模型更简单,预测的准确性得到更高。偏最小二乘回归于1983年由S.Wold和C.Albano等人首次提出,它集多元线性回归、典型相关分析和主成分分析的基本功能为一体,将建模预测类型的数据分析方法与非模型式的数据认识方法有机地结合起来,因此,偏最小二乘回归较传统的回归分析、主成
3、分分析具有更大优势,能较好地处理基于传统最小二乘回归方法难以解决的问题,在处理样本容量小、自变量多、变量间存在严重多重相关性问题方面具有独[6-7]特的优势,从而使模型精度、稳健性、实用性得到提高。偏最小二乘回归已广泛应用于诸多领域,取得[8-16]了良好的效果。本文充分考虑影响油田产量的相关因素,利用偏最小二乘回归方法建立模型,以实现对油田产量进行的预测。1偏最小二乘回归模型1.1建模原理设有p自变量X={x,x,L,x}和q个因变量Y={y,y,L,y},观测n个样本点,分别在X与Y12p12p中提取出成分t和u(即t是x,...,x的线性组合,u是y,.
4、..,y的线性组合),要求t和u应尽可能1111p11q11大地携带他们各自数据表中的变异信息,同时t与u的相关程度能够达到最大使得t和u应尽可能好的1111代表数据表X和Y,同时自变量的成分t对因变量的成分u又有最强的解释能力。11在第一个成分t和u被提取后,分别实施X对t的回归以及Y对u的回归。如果回归方程已经达到1111满意的精度,则算法终止;否则,将利用X被t解释后的残余信息以及Y被t解释后的残余信息进行第二11轮的成分提取。如此往复,直到能达到一个较满意的精度为止。若最终对X共提取了m个成分t,L,t1m,偏最小二乘回归将通过实施y对t,L,t的回归
5、,然后再表达成y关于原变量x,L,x的回归方程k1mk1m(k=1,2,L,q)。1.2算法推导基金项目:装甲兵工程学院创新基金项目(2008GL15)作者简介:董玉才(1973-),男,博士,副教授,主要从事计算方法和数据处理研究.1首先将数据做标准化处理。X经标准化处理后的数据矩阵记为E=(E,L,E),Y经标准化0010pn×pj处理后的数据矩阵记为F=(F,…,F)。0010qn×p第一步:记t1是E0的第一个成分,w1是E0的第一个轴,满足
6、
7、w1
8、
9、=1。记u1是F0的第一个成分,u=Fc。c是F的第一个轴,且c=1。求得轴w和c后,即可得到成分t
10、=Ew,u=Fc,然10110111101101后分别求E和F对t,u的三个回归方程0011''∗'E0=t1p1+E1F0=u1q1+F1F0=t1r1+F1式中,回归系数向量是'''E0t1F0u1F0t1p=q=r=121212
11、
12、t
13、
14、
15、
16、u
17、
18、
19、
20、t
21、
22、111∗其中E,F1,F分别是三个回归方程的残差矩阵。11第二步:用残差矩阵E和F取代E和F,然后求第二个轴w和c以及第二个成分t,u,有11002222''t2=E1w2u2=F1c2θ2==w2E1F1c2''2''w2是对应于矩阵E1F1F1E1最大特征值θ2的特征值,c2是对应于
23、矩阵F1E1E1F1最大特征值的特征向量。计算回归系数''E1t2F1t2p=r=2222
24、
25、t
26、
27、
28、
29、t
30、
31、22因此,有回归方程''E1=t2p2+E2F1=t2r2+F2如此计算下去,如果X的秩是A,则会有''''E0=t1p1+L+tApAF0=t1r1+L+tArA+FA*由于t,L,t均可以表示成E,L,E的线性组合,因此可以还原成y=F关于x*=E的回1A010pk0kj0k归方程形式,即**yk*=αk1x1+L+αkpxp+FAkk=1,2,L,q(1)F是残差距阵F的第k列。AkA1.3交叉有效性检验在偏最小二乘回归建模中,可通过考察增加一个
32、新的成分后,能否对模型的预测功能有明显