控制受约束的随机线性二次最优控制

控制受约束的随机线性二次最优控制

ID:31989718

大小:675.09 KB

页数:33页

时间:2019-01-30

控制受约束的随机线性二次最优控制_第1页
控制受约束的随机线性二次最优控制_第2页
控制受约束的随机线性二次最优控制_第3页
控制受约束的随机线性二次最优控制_第4页
控制受约束的随机线性二次最优控制_第5页
资源描述:

《控制受约束的随机线性二次最优控制》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、万方数据第一章引言本文考虑控制约束为瓞?的随机LQIh]题,证明了值函数V(t,X)关于时间变量t是Lipschitz连续的、关于初值变量x一阶连续可微且是凸的,进一步证明了值函数是HJB方程的强解(即值函数几乎处处满足HJB方程),通过值函数关于变量X的一阶偏导数给出最优控制的表达式.文章后面内容的结构如下:第二章先描述一般的最优控制问题,介绍最大值原理和动态规划原理以及它们的联系.然后介绍如何通过Riccati方程解决无约束的SLQ(司题.第三章讨论控制含有约束的SLQf司题.引入投影算子和拉回算子,证明最优控制的存在唯一性.随后证明了值函数v(t,x)关

2、于t是Lipschitz连续的以及关于X是连续可微且凸的,在此基础上证明了值函数是HJB方程的强解,通过值函数关于X的一阶偏导数给出最优控制的表达式.论文最后指出了需要进一步研究的一些问题.4万方数据第二章基础知识弟一早圣口函大U以§2.1随机最优控制问题设{w(f):t≥sJ是给定概率空间(Q,y-,p)上的d维{z5}仞标准Brown运动,其中冗5=o-(o-({W(r):S≤r≤f})uⅣ),Ⅳ是所有p一零测集.当s∈[0,丁],考虑扩散项不含控制的系统方程:{dx(D=易(‘x(D,“(D)d‘+旷(‘工o))dw(D,‘∈[s,丁】,(2.1.1)I

3、x(J)=Y,Y∈肽’2和代价函数:耶鸬删=E{,71m川川)¨m(丁))l(2.1.2)的随机最优控制问题,就是在允许控制集彩[s,丁]:q/[s,丁]全{M:Is,丁】×Q—UI“是{冗5},≥,适应的}(2.1.3)中寻找瓦(.)∈彩【s,T],使:地y,引)-㈣。i彩nfMJ(5,),,“(‘))-(2·l·4)记i(.)全X(.;瓦(.)),(夏(.),瓦(.))称为随机最优控制问题的最优对§2.2最大值原理最大值原理是求最优控制的基本工具,它描述了最优控制应当满足的条件.假设:(S1)集合Uc瓞”是R⋯中的Borel集.(S2)函数b:【0,T】×

4、R’1×U—÷瓞”,旷:【0,r】×R”—÷憾似d,f:【O,T]×R”×U_R,h:瞅一瓞可测,且存在L>0和模连续的石:【0,oo)j【0,。o),使得当5万方数据第二章基础知识妒=b,矿,^h时,满足:妒(f,X,U)一妒(f,-2,瓦)I≤LIx一-2l+石(IM一瓦1),Vt∈[0,丁],X,夏∈R”,U,瓦∈∽(2.2.1)妒(f,0,“)l≤L,V(f,曲∈[0,T]×U(S3)函数妒=b,正工向关于变量x是C2的,且存在L>0和模连续的石:[0,oo)一[0,co),使得当妒=b,矿,^h时,满足:妒,(^X,“)一妒。(r,夏,瓦)I≤LIx

5、—XI+石(I“一瓦f),qo,-x(t,X,“)一妒,。(f,i,瓦JI≤石(1x—XI+lu一瓦I),(2.2.2)Vt∈[0,丁】,X,-2∈R”,“,-ff∈U.考虑倒向随机微分方程:dp(t)=一Ib,(r,-2(t),瓦(r))Tp(f)+∑?:l一(,,夏(f),瓦(f))Tqj(t)一L(t,x(,),瓦(r))}df+g(f)dW(f),t∈【S,丁],p(T)=一hx(i(丁)).(2.2.3)记诈(s,丁;觥)={“:Is,丁】xQ_UI“是{霄}伽-适应的瓞”值过程,且满足Ef7’I酬2dt

6、妻(s,T;N”)×彩[s,丁],在问题满足的假设条件下,(2.2.3)有唯一适应解(p(·),q(·))∈L≥沁T;R”)×(碜(s,T;R’1))d(请参见文献[24】第七章).(2.2.3)称为最优控制问题的对偶方程.定义Hamilton函数为:H(f,z,“,p,g)=(p,易(t,x,u))+‘r[qTo-(‘,x)]一f(t,x,u),(2.2.4)(f,X,M,P,q)∈Is,丁】×Ⅱ匙”×UXⅡ廷”×R”×d,6万方数据第二章基础知识其中(p(·),g(·))是(2.2.3)的解.矿=O时,(2.2.4)和确定性系统对于Hamilton函数定义

7、是一致的.随机最大值原理(SMP)为:H(t,-5(t),if(t),p(f),g(f))=ma.x.H(t,i(f),U,p(f),g(f)),a.e.f∈【s,丁],p一日.s.“∈U(2.2.5)注2.2.】.SLQIh]题不满足假设(S2),但由于系统参数关于状态变量和控制变量是线性的,代价泛函关于状态状态变量和控制变量是二次的,类似【24]第三章中的证明,可验证SLQ问题也满足最大值原理.也可参见【24]第六章.此部分更多内容请参见文献【24】第三章.§2.3动态规划原理禾nHJB方程动态规划原理也是求最优控制的基本工具.它给出了Hamilton—J

8、acobi—Bellman方程,如果方

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。