资源描述:
《算法大全第18章 变分法模型.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第十八章动态优化模型动态过程的另一类问题是所谓的动态优化问题,这类问题一般要归结为求最优控制函数使某个泛函达到极值。当控制函数可以事先确定为某种特殊的函数形式时,问题又简化为求普通函数的极值。求解泛函极值问题的方法主要有变分法和最优控制理论方法。§1变分法简介变分法是研究泛函极值问题的一种经典数学方法,有着广泛的应用。下面先介绍变分法的基本概念和基本结果,然后介绍动态系统最优控制问题求解的必要条件和最大值原理。1.1变分法的基本概念1.1.1泛函设S为一函数集合,若对于每一个函数x(t)∈S有一个实数J与之对应,则称J是对应在S上的泛函,记作J(x(t))。S称为J的容许函数集。通俗地说
2、,泛函就是“函数的函数”。例如对于xy平面上过定点A(x,y)和B(x,y)的每一条光滑曲线y(x),绕x轴1122旋转得一旋转体,旋转体的侧面积是曲线y(x)的泛函J(y(x))。由微积分知识不难写出x22J(y(x))=∫2πy(x)1+y'(x)dx(1)x1容许函数集可表示为1S={y(x)
3、y(x)∈C[x,x],y(x)=y,y(x)=y}(2)121122最简单的一类泛函表为t2J(x(t))=∫F(t,x,x&)dt(3)t1被积函数F包含自变量t,未知函数x及导数x&。(1)式是最简泛函。1.1.2泛函的极值泛函J(x(t))在x(t)∈S取得极小值是指,对于任意一个与
4、x(t)接近的00x(t)∈S,都有J(x(t))≥J(x(t))。所谓接近,可以用距离d(x(t),x(t))<ε来度量,00而距离定义为d(x(t),x(t))=max{
5、x(t)−x(t)
6、,
7、x&(t)−x&(t)
8、}000t1≤t≤t2泛函的极大值可以类似地定义。x(t)称为泛函的极值函数或极值曲线。01.1.3泛函的变分如同函数的微分是增量的线性主部一样,泛函的变分是泛函增量的线性主部。作为泛函的自变量,函数x(t)在x(t)的增量记为0δx(t)=x(t)−x(t)0也称函数的变分。由它引起的泛函的增量记作ΔJ=J(x(t)+δx(t))−J(x(t))00如果ΔJ可以表为
9、-218-ΔJ=L(x(t),δx(t))+r(x(t),δx(t))00其中L为δx的线性项,而r是δx的高阶项,则L称为泛函在x(t)的变分,记作0δJ(x(t))。用变动的x(t)代替x(t),就有δJ(x(t))。00泛函变分的一个重要形式是它可以表为对参数α的导数:∂δJ(x(t))=J(x(t)+αδx(t))(4)α=0∂α这是因为当变分存在时,增量ΔJ=J(x(t)+αδx)−J(x(t))=L(x(t),αδx)+r(x(t),αδx)根据L和r的性质有L(x(t),αδx)=αL(x(t),δx)r(x(t),αδx)r(x(t),αδx)lim=limδx=0α→0
10、αα→0αδx所以∂J(x+αδx)−J(x)J(x+αδx)=limα=0∂αα→0αL(x,αδx)+r(x,αδx)=lim=L(x,δx)=δJ(x)α→0α1.1.4极值与变分利用变分的表达式(4)可以得到泛函极值与变分的关系:若J(x(t))在x(t)达到极值(极大或极小),则0δJ(x(t))=0(5)0这是因为对任意给定的δx,J(x+αδx)是变量α的函数,该函数在α=0处达到极0值。根据函数极值的必要条件知∂J(x+αδx)=00α=0∂α于是由(4)式直接得到(5)式。1.1.5.变分法的基本引理1引理ϕ(x)∈C[x,x],∀η(x)∈C[x,x],η(x)=η(
11、x)=0,有121212x2∫ϕ(x)η(x)dx≡0,x1则ϕ(x)≡0,x∈[x,x]。121.2无约束条件的泛函极值求泛函tfJ=∫F(t,x(t),x&(t))dt(6)t0的极值,一般是用泛函极值的必要条件去寻找一条曲线x(t),使给定的二阶连续可微*函数F沿该曲线的积分达到极值。常称这条曲线为极值曲线(或轨线),记为x(t)。1.2.1端点固定的情况设容许曲线x(t)满足边界条件-219-x(t)=x,x(t)=x(7)00ff且二次可微。首先计算(6)式的变分:∂δJ=J(x(t)+αδx(t))α=0∂αtf∂=F(t,x(t)+αδx(t),x&(t)+αδx&(t))
12、dt∫tα=00∂αtf=∫[Fx(t,x,x&)δx+Fx&(t,x,x&)δx&]dt(8)t0对上式右端第二项做分布积分,并利用δx(t)=δx(t)=0,有0ftftfd∫tFx&(t,x,x&)δx&dt=−∫tFx&(t,x,x&)δxdt,00dt再代回到(8)式,并利用泛函取极值的必要条件,有tfdδJ=∫[Fx−Fx&]δxdt=0t0dt因为δx的任意性,及δx(t)=δx(t)=0,所以由基本引理得到著名的欧拉