资源描述:
《用变分法求解最优控制问题》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、5.3用变分法求解最优控制问题回顾最优控制问题的提法:m求容许控制函数u(t)∈V,V⊂R使系统x&(t)=f[]x(t),u(t),t由给定的初始状态x(t)=x出发,在末端时刻t>t转移到00f0目标集nM={x(t:)x(t)∈R,g(x(t),t)=0,g(x(t),t)≤,0ff1ff2fflqg∈R,g∈R,l≤n}12[]tf并使性能指标J=φx(t),t+L[]x(t),u(t),tdt为最小ff∫t0或最大。1古典变分法只能解决控制变量不受约束或受开集性约束的最优控制问题,而对控制变量受闭
2、集性约束的最优控制问题无能为力。假设:m.1控制域V为开集或为全空间R,容许控制函数u(t)是连续或分段连续函数。.2f[]⋅、φ[]⋅、L[][]⋅、g⋅对其自变量x(t),u(t),t具有充分的可微性。.3目标集只考虑等式约束的情况。21.5.3末端时刻t固定,末端状态x(t)自由时的变分问题ff问题1.5.3已知受控系统x&=f(x,u,t),x(t)=x,求u(t),00[]tf使性能指标J=φx(t)+L[]x(t),u(t),tdt取最小值,f∫t0其中x(t)为n维状态向量,u(t)为m维控制
3、向量,m≤n,t固定。f[]T引入拉格朗日乘子函数λ(t)=λ(t)λ(t)Lλ(t),12n将等式约束f(x,u,t)−x&=0和原来的泛函J结合成一个新的泛函tfTJ′=φ[]x(t)+{}L[]x(t),u(t),t+λ(t)[]f(x,u,t)−x&dtf∫t0定义[]TH(x,u,λ,t)=Lx(t),u(t),t+λ(t)f(x,u,t)H(x,u,λ,t)为一标量函数,常称为哈密顿(Hamilton)函数。3tfT则J′=φ[]x(t)+{H(x,u,λ,t)−λ(t)x&(t)}dt)1(f
4、∫t0对)1(式右边最后一项进行分部积分,得[]TTJ′=φx(t)+λ(t)x(t)−λ(t)x(t)f00fftf+{}Hxut+&Ttxtdt∫(,,λ,)λ()())2(t0∂[]***δJ′=J′x(t)+εδx(t),u(t)+εδu(t),x(t)+εδx(t)ffε=0∂εTTT⎡⎛∂φ⎞⎤tf⎡⎛∂H&⎞⎛∂H⎞⎤=⎢⎜−λ⎟δx⎥+∫⎢⎜+λ⎟δx+⎜⎟δu⎥dt⎢⎣⎝∂x⎠⎥⎦t0⎢⎣⎝∂x⎠⎝∂u⎠⎥⎦t=tf=0)3(4现选择λ(t)满足如下条件:∂Hλ&(t)=−∂x∂φ(x(t
5、))fλ(t)=f∂x(t)f则方程)3(变为Ttf⎛∂H⎞∫⎜⎟δudt=0t0⎝∂u⎠再由δu(t)取值的任意性及引理1.3,推得∂H=0∂u5综上所述,问题1.5.3中的泛函J取极值的必要条件是:∂H⎫x&(t)=f(x,u,t)=∂λ⎪⎪⎬正则(规范、共轭)方程&∂H⎪λ(t)=−(协态方程)∂x⎪⎭[]T其中H(x,u,λ,t)=Lx(t),u(t),t+λ(t)f(x,u,t)x(t)=x⎫00⎪∂φ(x(tf))⎬边界条件λ(t)=(横截条件)f⎪∂x(t)f⎭∂H=0极值条件∂u6用变分法求
6、解最优控制问题最终归结为求解微分方程的两点边值问题。7哈密顿函数的重要性质:沿最优轨线哈密顿函数对时间t的全导数等于对t的偏导数,即dH∂H=dt∂t当哈密顿函数不显含t时,则有H(t)=常数,t∈[]t,t0f即当哈密顿函数不显含t时,哈密顿函数沿最优轨线为一常数。8定理1.5.3对于问题1.5.3,必存在函数λ(t),使得最优控制**u(t)、最优轨线x(t)和λ(t)满足如下必要条件:1)正则方程∂Hx&(t)=f(x,u,t)=∂λ∂Hλ&(t)=−∂x[]T其中H(x,u,λ,t)=Lx(t),u
7、(t),t+λ(t)f(x,u,t)2)边界条件x(t)=x00∂φ(x(t))fλ(t)=f∂x(t)f3)极值条件∂H=0∂u9例1.5.3已知受控系统x&=u,x(t)=x,求最优控制00*121tf2u(t),使性能指标J=cx(t)+u(t)dt为最小值,f∫22t0其中常数c>0。12解:这里哈密顿函数为H=u+λu,最优解的必要条件为21)x&=u∂Hλ&=-=0∂x)2x(t)=x00⎡12⎤∂cx(t)⎢f⎥⎣2⎦λ(t)==cx(t)ff∂x(t)f∂H)3=u+λ=0∂u10解得最优控
8、制cx*0u(t)=−1+c(t−t)f0112.5.3末端时刻t固定,末端状态x(t)受约束时的变分问题ff一、末端时刻t固定,末端状态x(t)固定的情况ff问题2.5.3已知受控系统x&=f(x,u,t),x(t)=x,x(t)=x,00fftf求u(t),使性能指标J=∫L[]x(t),u(t),tdt取最小值,其中x(t)t0为n维状态向量,u(t)为m维控制向量,m≤n,t固定。f[]T引入拉格朗日乘子