多智能体q学习在多auv协调中的应用与仿真

多智能体q学习在多auv协调中的应用与仿真

ID:34769341

大小:4.61 MB

页数:74页

时间:2019-03-10

多智能体q学习在多auv协调中的应用与仿真_第1页
多智能体q学习在多auv协调中的应用与仿真_第2页
多智能体q学习在多auv协调中的应用与仿真_第3页
多智能体q学习在多auv协调中的应用与仿真_第4页
多智能体q学习在多auv协调中的应用与仿真_第5页
资源描述:

《多智能体q学习在多auv协调中的应用与仿真》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:——UDC:——密级:编号:工学硕士学位论文多智能体Q学习在多AUV协调中的应用与仿真硕士研究生:指导教师:学位级别:学科、专业:所在单位:论文提交日期:论文答辩日期:学位授予单位;李锋严浙平教授工学硕士交通信息工程及控制自动化学院2008年1月2008年3月哈尔滨工程大学多智能体Q学习在多AUV协调中的应用与仿真摘要AUV(AutonomousUnderwaterVehicle,简称AUV)作为一种高技术手段,在海洋环境监测、海底资源调查、科学考察、危险环境作业和打捞救生等方面起到了至关重要的作用。随着执行任务的复杂性日益增加,单AUV在大范围内作业的时效性、鲁棒性和柔性等方面就

2、表现出明显不足。需要多个AUV构成系统来共同完成任务,而多AUV的协调控制成为关键问题,本论文主要讨论了一种新的多AUV协调控制方法、系统设计及仿真。本文首先介绍了多AUV技术的发展动态以及课题研究的意义,然后根据多AUV协调控制系统的需要建立AUV运动模型、多智能体Q学习模型,在此基础上建立了面向任务的多AUV系统结构。对比分析了近几年的几种重要的多智能体强化算法,然后提出了一种新的多智能体Q学习算法,这种算法结构简单,能够大大简化状态空间,加快收敛速度。试验表明,本文提出的多智能体Q学习方法是有效的。然后对多智能体Q学习算法实现多AUV协调的系统进行了设计,用多个仿真实例说明了多智能体

3、Q学习算法在多AUV系统中的应用,试验证明,此本文提出的多智能体Q学习协调算法在满足Nash均衡的同时,避免了研究多个均衡点同时存在的问题,收敛速度快并且非常有效。关键词:多智能体;Q学习;hash均衡;多AUV;仿真哈尔滨T群人学硕十学何论文ABSTRACTAutonomousUnderwaterVehicle(AUV)playsanimportantroleinmarineenvironmentmonitoting,seabedresourcesinvestigating,sciencerespecting,dangerousenvironmentexploring,rescueand

4、salvageandSOon.Alongwiththemissionbecomemorecomplicatedly,thesingleAUVobviouslyshowsinsufficientateffectiveness,robustnessandflexibilityinalarge。scaleoperatingmission-ItISnecessarytocoordinatewiththehelpofMulti—AUVsoperatingtogether,alldcooperationisthekeytechniquesofMulti-AUVs.Inthispaperacoopera

5、tivestrategy,aMulti.AUVscooperativesystem’sdesignandit’Ssimulationarediscussed.Firstly,thetrendofmultipleAUVsdevelopmentandtheresearchmeaningarepresented.ThenaAUVdynamicmodel,multiagentQ·learningmodelisdesignedbasedontheneedofmultipleAUVssystem,andanewarchitecture0tAUVbasedonmissionisproposed.Then

6、,severalsingleagentandmultiagentreinforcementlearningalgorithmsproposedinrecentyearsareinvestigated,comparedandanalyzeddeeplyinthispaper.AndamuliagentQ‘learningalgorithmisproposed.Thisalgorithminvolvessimpleproceduresandeasycomputations,andcanguaranteegoodlearningconvergence·Experimentresultsofmul

7、ti.AUV,scoordinationandcontrolshowthatthisalgorithmiseffective·Then.aMulti.AUVscooperativesystembasedonmuliagentQ。learningalgorithmisdesinged.SeveralsimulationexperimentshowtheapplicationofmuliagentQ.1earningalgo

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。