多智能体的协作与规划研究及其在robocup中的应用

多智能体的协作与规划研究及其在robocup中的应用

ID:33976355

大小:3.10 MB

页数:62页

时间:2019-03-02

多智能体的协作与规划研究及其在robocup中的应用_第1页
多智能体的协作与规划研究及其在robocup中的应用_第2页
多智能体的协作与规划研究及其在robocup中的应用_第3页
多智能体的协作与规划研究及其在robocup中的应用_第4页
多智能体的协作与规划研究及其在robocup中的应用_第5页
资源描述:

《多智能体的协作与规划研究及其在robocup中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要近年来,有关Multi.agent系统(MAS)与分布式人工智能(DAD的研究,已经成为人工智能领域的重要研究方向之一。而RoboCup则是以MAS和分布式人工智能为主要研究背景,其使命就是促进分布式人工智能与智能机器人技术的研究与教育。该研究方向要求在一个实时动态变化的和不可预测的环境中,拥有自主能力的Agent,作为团队的一部分,能自动地进行有效的动作,完成整个队伍的目标。本文以RoboCup仿真比赛为检验平台,以多智能体系统为研究对象,主要进行了以下工作:首先,选择智能体间协作作为目标任务,在对己有的协作策略进行研究的基础上,分别从静态和动

2、态出发,研究了基于静态阵形和动态阵形的阵形变化策略,有效的增强了球队的整体实力;并且还采用了基于合作意愿矩阵的规划协作策略,很好的改善了球队整体协作进攻能力。其次,由于Q学习不能适用于连续状态空间和动作空间的学习,随着状态空间的增大,Q值在内存中的存储以及查询变得困难,会导致维数灾难,且传统的强化学习不具有泛化能力,这些缺点限制了它在复杂多变的环境中的应用。为了解决这些存在的问题,采用模糊Q学习算法以及基于信度分配模糊CMAC(CA--FCMAC)的Q学习算法,并将算法用于RoboCup仿真比赛中,通过实验证明改进后算法有效的优化了Agent个体技术

3、。最后,在MAS中,由于外部环境提供信息较少,强化学习的学习效率通常较低。采用具有先验知识的算法来优化学习状态,提高学习效率。并结合心理学中的内在激励思想,提出基于先验知识的内在激励强化学习,并将此算法运用到MAS局部配合技术的训练中,实验表明,这种算法能够提高球队的局部协作能力。关键词:多智能体系统;机器人足球世界杯;协作与规划;强化学习;智能控制AbstractRecently,theresearchonmulti-agentsystemanddistributedartificialintelligencebecomesamainsubfiel

4、dofartificialintelligence.MASandDAIarethemajorbackgroundofRoboCup,whichtaskistopromotetheresearchandeducationofdistributedartificialintelligenceandintelligencerobotics.Thisresearchneedagent,whichoneoftheteam,Canachievevariableactionandaccomplishtheteam’saiminarealtime,dynamican

5、dunpredictenviroment.ThisdissertationtakestheRoboCupsimulationleagueastestbed,takesthemulti—agentsystem猫targetofstudy,mainlyhascarriedonthefollowingwork:Fisrtly,aflerstudyingtheexistingcooperationstrategiesinMAS,thispaperchoosescooperationinMAS嬲task,applythecooperationstrategie

6、sbasedonthestaticanddynamiclineuprespectivelyfromstaticanddynamicaspectswhichextremelyeffectiveincreasedteam'soverallcapability,andusethestrategybasedonthecooperativedesirematrixwhichhighlyimprovedtheattackingcompetence.Secondly,Qlearningisn’tadapttocontinuousstatespaceandactio

7、napace,andwiththeincreasingofthestatespace,theQvaluememoryaswellasinquirybecomesdifficult,therewillleadtodimensionaldisaster.Otherwise,traditionalreinforcementlearninghasn'ttheabilityofgeneralization.Allofthesedisadvantagesrestrictitsapplicationinthecomplexandvariableenvironmen

8、t.Inordertosolvethoseproblems,weusethefuzzyQlearningan

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。