基于性能势的随机系统最优控制

基于性能势的随机系统最优控制

ID:33361369

大小:1.53 MB

页数:68页

时间:2019-02-25

基于性能势的随机系统最优控制_第1页
基于性能势的随机系统最优控制_第2页
基于性能势的随机系统最优控制_第3页
基于性能势的随机系统最优控制_第4页
基于性能势的随机系统最优控制_第5页
资源描述:

《基于性能势的随机系统最优控制》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要摘要本文主要研究随机系统的最优控制问题,寻找适用于非线性系统的在线优化算法。论文将随机控制系统看作连续状态的马尔可夫决策过程,通过系统的性能势建立优化方程,进一步利用优化方程得到策略迭代算法。性能势可以由系统的样本路径估算得到,该算法既适用于线性系统又适用于非线性系统,并且便于在线计算。全文由以下五部分组成:第一部分:介绍随机系统最优控制的研究背景和意义,概述随机系统最优控制的研究历史和现状、研究内容和研究方法。第二部分:介绍本文所需的预备知识,包括常用的随机过程,特别介绍了马尔可夫过程和随机系统最优控制的一般理论。

2、第三部分:将随机控制系统看作马尔可夫决策过程,根据系统的性能势建立优化方程和策略迭代算法。进一步给出在线算法的方法和步骤,并尝试利用神经网络来加快在线算法的计算速度。第四部分:将基于性能势的策略迭代算法应用到随机线性系统最优控制问题上,得到了求解最优控制律的黎卡提方程,其导出过程有别于传统方法。并将该算法与贝尔曼动态规划法相比较,分析各自的特点。第五部分:对全文进行总结,对今后的研究趋势进行展望,并指出有待进一步研究的问题。关键词:随机系统,最优控制,性能势,策略迭代AbstractInthispaper,Wemainr

3、esearchtheoptimalcontrolforstochasticsystems,toseektheon.1inealgorithmWhiehc肌solveaclassofnOnlinerstochasticsystems.Wjfirstregardstochasticcontrolsystems勰Markovdeeisionproblemsandestablishoptimalequationwhichbasedonperformancepotential.andthenapplytheoptimalequat

4、iontopolicyiterationtogetthealgorithm.Thealgorithmappliestolinearaswellasnon—linearsystemsandcarlbeimplementedon-line.ThewholePaDel-includesthefollowingfiveparts:InPart0ne:IntroducingthepurportandbackgroundofoptimalcontrolforStochasticsystems.Andtheresearchhistor

5、y,presentstatus,andresearcheotltents,researchmethodsalealsosummarized.InPartTwo:nlepreparativeknowledgeinthispaperisgiven,includingthebasicconceptsofstochasticprocess.WeespeciallyintroducedtheMarkovprocessandthecurrentlytheoryofoptimalcontrolforstochasticsystems.

6、InPartThree;WefirstregardstochasticcontrolsystemsasMarkovdecisionproblems,thenestablishtheoptimalequationbasedpotentialandthenapplytheoptimalequationtopolicyiterationtogetthealgorithm.Atlast,Weintroducetheon-linealgorithmandconstructRBFileal"alnetworkstolowercomp

7、uting.InPartFota':Weapplythepolicyiterationapproachtothestochasticlinearsystems.WjcallobtaintheRiceatiequationinanotherway,andprovideacomparisonofthepolicyiterationapproachandthedynamicprogramming.InPartFive:AftersummarizingthewholePaD瓯thepresentproblemsareindica

8、ted.andthentheresearchtrendisprospected.Keywords:stochasticsystem,optimalcontrol,performancepotentialpolicyiteration东南大学学位论文独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。