基于自适应动态规划的无人机编队最优协同控制研究

基于自适应动态规划的无人机编队最优协同控制研究

ID:34595260

大小:1.58 MB

页数:79页

时间:2019-03-08

基于自适应动态规划的无人机编队最优协同控制研究_第1页
基于自适应动态规划的无人机编队最优协同控制研究_第2页
基于自适应动态规划的无人机编队最优协同控制研究_第3页
基于自适应动态规划的无人机编队最优协同控制研究_第4页
基于自适应动态规划的无人机编队最优协同控制研究_第5页
资源描述:

《基于自适应动态规划的无人机编队最优协同控制研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中图分类号:TP273论文编号:102870318-SX124学科分类号:081101硕士学位论文基于自适应动态规划的无人机编队最优协同控制研究研究生姓名魏阿龙学科、专业控制理论与控制工程研究方向故障检测与容错控制指导教师刘春生教授南京航空航天大学研究生院自动化学院二О一八年一月NanjingUniversityofAeronauticsandAstronauticsTheGraduateSchoolCollegeofAutomationEngineeringResearchonAdaptiveDynamicProgramming

2、-BasedOptimalCooperativeControlofUAVFormationAThesisinControlTheoryandControlEngineeringbyWeiAlongAdvisedbyProf.LiuChunshengSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofEngineeringJanuary,2018承诺书本人声明所呈交的硕士学位论文是本人在导师指导下进行的研究工作及取得的研究成果。除了文中特别加以标注和

3、致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得南京航空航天大学或其他教育机构的学位或证书而使用过的材料。本人授权南京航空航天大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本承诺书)作者签名:日期:南京航空航天大学硕士学位论文摘要本论文基于自适应动态规划(AdaptiveDynamicProgramming,ADP)方法,结合一致性理论,对无人机编队的最优协同控制进行研究。首先建立一致性误差动态模型,基于此模型,

4、主要从三个方面深入分析和研究相应的协同控制技术:讨论无人机系统输入受限情形下的一致性问题,讨论无人机系统模型部分未知和模型完全未知情形下的一致性问题。主要内容有:(1)针对编队中的无人机系统存在输入饱和受限情形,提出了分布式自适应最优控制方案求解其非零和微分博弈问题。为解决输入受限造成的不连续问题,选用一个合适的非二次型泛函将问题转化为可求解的优化问题。为每架无人机设计单网络结构来近似耦合哈密顿-雅克比(Hamilton-Jacobi,HJ)方程的解,进而求得分布式最优协同控制律。对于无人机的编队系统,使用单网络而不是自适应动态规

5、划典型的双网结构优势更加突出,因为这样不但可以减少对无人机的内存需求还可以减少计算负担。此外所有无人机的神经网络(NeuralNetwork,NN)权值更新都是同时且连续的,这也使得所得控制律是平滑的。(2)针对模型部分未知的无人机编队系统的最优协同控制问题,提出了基于辨识-评价结构的在线自适应最优控制方案。一般地,非线性非零和微分博弈最优协同控制的关键是耦合HJ方程的求解。由于存在不确定性,针对每一架无人机,分别使用一个辨识NN用于估计无人机系统的未知动态和一个评价NN用于近似耦合HJ方程的解(最优值函数),继而导出最优协同控制

6、律。基于辨识-评价结构,辨识NN和评价NN可以同步调整权值。(3)针对模型完全未知且存在干扰的情形,提出了一种新的数据驱动ADP算法。首先提出了基于模型的策略迭代算法,然后证明了值函数和控制策略的迭代序列收敛于最优函数。为了放松算法对系统模型准确信息的依赖,结合前面基于模型的算法和积分强化学习(IntegralReinforcementLearning,IRL)技术,推导出了无模型(modelfree)迭代方程。进一步提出一种数据驱动的迭代ADP方法,利用生成的系统数据来求解无模型迭代方程。并且从理论上证明了这种无模型迭代方程等价

7、于基于模型的迭代方程。这意味着数据驱动算法可以近似最优值函数和控制策略。关键词:自适应动态规划(ADP),分布式控制,最优协同控制,非零和微分博弈,输入受限,数据驱动I基于自适应动态规划的无人机编队最优协同控制研究ABSTRACTThisthesisstudiestheoptimalcooperativecontrolofUAVformationbasedontheadaptivedynamicprogrammingmethodandtheconsensustheory.Firstly,theconsensuserrordynam

8、icmodelisestablished.Basedonthismodel,thecorrespondingcooperativecontroltechniquesareformulatedanddevelopedfromthreeaspects:

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。