资源描述:
《最优化与最优控制讲义第3章极大值原理》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第三章极大值原理前面一章介绍的变分法属于经典变分学的内容。经典变分学只能解决容许控制属于开集的一类最优控制问题,而且对轨线x(t)、函数L、f均有连续可微要求。而在实际工程应用问题中,这些要求一般是无法得到满足的。极大值原理就是为了解决容许控制属于闭集的一类最优控制问题而提出来的。极大值原理(MaximumPrinciple),或称最大值原理,也有称为极小值原理或最小值原理(MinimumPrinciple),是前苏联数学家庞特里亚金(俄文ЛОНТЛЯТИН,英文Pontryagin)受力学中amilton原理启发,于1958年提出并加以证明的。
2、极大值原理的提出,将经典变分学推进到现代变分学,也成为了现代控制理论的重要基石。3.1泛函极值的充分条件(1)几个有关定义I.正常场定义3-1:若(t,x)平面某一区域D上每一点都有曲线族x=x(t,c)中一条且仅有一条通过,则称曲线族在区域D上形成一个正常场。曲线族x=x(t,c)上点(t,x)处的切线的角系数称为场在点(t,x)的斜率。II.中心场定义3-2:若区域D上曲线族x=x(t,c)的全部曲线都通过一点(t0,x0),即它们形成曲线束,且束心也属于D,同时除束心外,曲线在D内不再相交,曲线布满区域D,则该场为中心场。III.极值曲线场定
3、义3-3:若正常场或中心场是由某一变分问题的极值曲线族所形成,则称之为极值曲线场。(2)维尔斯特拉斯E函数(WeierstrassErdmannFunction)设有泛函tfJ(x)=∫L[x(t),x&(t),t]dt(3-1-1)t0若用p(x,t)表示其极值曲线场中极值曲线斜率,则可以证明泛函增量可表示为tf∆J(x)=∫E[x(t),x&(t),p(x,t),t]dt(3-1-2)t0其中∂E[x,x&,p,t]=L[x,x&,t]−L[x,p,t]−[x&−p]L[x,p,t](3-1-3)∂p称为维尔斯特拉斯E函数。(3)泛函J在曲线上
4、达到极值的充分条件28设泛函J在曲线c上达到极值,可分为弱极值和强极值两种情况,其充分条件分别为:对于弱极值,1)曲线c应是满足极值条件的极值曲线;2)极值曲线c能够被包含在极值曲线场中;3)对于c近旁所有点(x,t)以及近于p(x,t)的x&值,函数E(x,x&,p,t)不变号,极小值时E≥0,极大值时E≤0。对于强极值,1)曲线c应是满足边界条件的极值曲线;2)极值曲线c能够被包含在极值曲线场中;3)对于c近旁所有点(x,t)以及任意的x&值,函数E(x,x&,p,t)不变号,极小值时E≥0,极大值时E≤0。3.2连续系统极大值原理考虑系统状态
5、方程x&(t)=f[x(t),u(t),t](3-2-1)nm其中,x(t)∈R,u(t)∈R,m≤n初始状态x(t)=x(3-2-2)00终态满足ψ[x(t),t]=0(3-2-3)ffr其中,ψ∈R,r≤n。u(t)属于有界闭集Ω,受不等式g[x(t),u(t),t]≥0(3-2-4)*约束,g为p维连续可微函数,p≤m。求最优控制u(t),满足上列条件,并使性能指标tfJ(u)=Φ[x(t),t]+L[x(t),u(t),t)]dt(3-2-5)ff∫t0达到极小值。这里与前面讨论的问题不同的是u(t)有界并受不等式约束。u(t)有界一般可以
6、考虑为是分段连续函数,对不等式约束则要设法转化为等式约束处理。引进新变量Z(t)和w(t),取2[Z&(t)]=g[x(t),u(t),t],Z(t)=0(3-2-6)029w&(t)=u(t),w(t)=0(3-2-7)0这里,取Z&2=g可以保证g非负;而由u(t)的分段连续性,有w&(t)的分段连续性,则进一步有w(t)分段光滑连续。因此,可以采用Lagrange乘子法进行求解。nrp分别取Lagrange乘子λ∈R,ν∈R,γ∈R,构造广义性能指标TJ(u)=Φ[x(t),t]+ν(t)ψ[x(t),t]affff+tf{L(x,w&,t)
7、+λT[f(x,w&,t)−x&]+γT[g(x,w&,t)−Z&2]}dt(3-2-8)∫t0取TH(x,λ+,w&,t)=L(x,w&,t)λf(x,w&,t)(3-2-9)TT2F(x,x&,w&,Z&,λ,γ,t)=H(x,λ,w&,t)−λx&+γ[g(x,w&,t)−Z&](3-2-10)则有TtfJa(u)=Φ[x(tf),tf]+ν(t)ψ[x(tf),tf]+∫tF(x,x&,w&,Z&,λ,γ,t)dt(3-2-11)0求其一阶变分有δJ=δJ+δJ+δJ+δJ(3-2-12)atfxwZ其中各部分分别为T∂Ttf+δtf∂Φ∂
8、ψδJtf={Φ+νψ+∫tFdt}tfδtf={+ν+F}tfδtf(3-2-∂tf∂t∂tfff13)T∂TtfT∂F