欢迎来到天天文库
浏览记录
ID:33361369
大小:1.53 MB
页数:68页
时间:2019-02-25
《基于性能势的随机系统最优控制》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、摘要摘要本文主要研究随机系统的最优控制问题,寻找适用于非线性系统的在线优化算法。论文将随机控制系统看作连续状态的马尔可夫决策过程,通过系统的性能势建立优化方程,进一步利用优化方程得到策略迭代算法。性能势可以由系统的样本路径估算得到,该算法既适用于线性系统又适用于非线性系统,并且便于在线计算。全文由以下五部分组成:第一部分:介绍随机系统最优控制的研究背景和意义,概述随机系统最优控制的研究历史和现状、研究内容和研究方法。第二部分:介绍本文所需的预备知识,包括常用的随机过程,特别介绍了马尔可夫过程和随机系统最优控制的一般理论。
2、第三部分:将随机控制系统看作马尔可夫决策过程,根据系统的性能势建立优化方程和策略迭代算法。进一步给出在线算法的方法和步骤,并尝试利用神经网络来加快在线算法的计算速度。第四部分:将基于性能势的策略迭代算法应用到随机线性系统最优控制问题上,得到了求解最优控制律的黎卡提方程,其导出过程有别于传统方法。并将该算法与贝尔曼动态规划法相比较,分析各自的特点。第五部分:对全文进行总结,对今后的研究趋势进行展望,并指出有待进一步研究的问题。关键词:随机系统,最优控制,性能势,策略迭代AbstractInthispaper,Wemainr
3、esearchtheoptimalcontrolforstochasticsystems,toseektheon.1inealgorithmWhiehc肌solveaclassofnOnlinerstochasticsystems.Wjfirstregardstochasticcontrolsystems勰Markovdeeisionproblemsandestablishoptimalequationwhichbasedonperformancepotential.andthenapplytheoptimalequat
4、iontopolicyiterationtogetthealgorithm.Thealgorithmappliestolinearaswellasnon—linearsystemsandcarlbeimplementedon-line.ThewholePaDel-includesthefollowingfiveparts:InPart0ne:IntroducingthepurportandbackgroundofoptimalcontrolforStochasticsystems.Andtheresearchhistor
5、y,presentstatus,andresearcheotltents,researchmethodsalealsosummarized.InPartTwo:nlepreparativeknowledgeinthispaperisgiven,includingthebasicconceptsofstochasticprocess.WeespeciallyintroducedtheMarkovprocessandthecurrentlytheoryofoptimalcontrolforstochasticsystems.
6、InPartThree;WefirstregardstochasticcontrolsystemsasMarkovdecisionproblems,thenestablishtheoptimalequationbasedpotentialandthenapplytheoptimalequationtopolicyiterationtogetthealgorithm.Atlast,Weintroducetheon-linealgorithmandconstructRBFileal"alnetworkstolowercomp
7、uting.InPartFota':Weapplythepolicyiterationapproachtothestochasticlinearsystems.WjcallobtaintheRiceatiequationinanotherway,andprovideacomparisonofthepolicyiterationapproachandthedynamicprogramming.InPartFive:AftersummarizingthewholePaD瓯thepresentproblemsareindica
8、ted.andthentheresearchtrendisprospected.Keywords:stochasticsystem,optimalcontrol,performancepotentialpolicyiteration东南大学学位论文独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及
此文档下载收益归作者所有