欢迎来到天天文库
浏览记录
ID:43548865
大小:827.06 KB
页数:60页
时间:2019-10-10
《基于强化学习多机器人协作控制方法地研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、沈阳理工大学硕上学位论文摘要多机器人协作是研究机器人领域的一项重要课题。由于多机器人协作可以完成单机器人无法完成的工作,因此越来越多的学者专注于多机器人系统的研究。目前对于多机器人系统而言,外部环境复杂多变且其可能面临多种选择,若只提供相对的控制参数,多机器人之间将难以形成有效的协作,难免产牛资源浪费和冲突。为促进机器人有效协作和系统优化,研究学者更加注重了机器人自身的学习能力。强化学习算法是近儿年发展起来的一种重要的机器学习方法,它是机器人通过感知环境信息來学习系统的最优策略。机器人通过不断的试错和与环境的交互来改善自身行为,从而具有了自主学习的能力,可以有效地完成协
2、作。为此木文对基于强化学习的多机器人协作控制方法进行了深入研究,所做了工作如下:(1)系统分析了多机器人系统的概念和组织行为,釆用强化学习理论和方法,研究机器人的路径规划问题。通过试错-评价的在线学习,使机器人选择优化的路径从起点运动到冃标点,得到所需的机器人运动行为的规划规则,为进一步研究多机器人系统协作行为的控制方法奠定理论基础。(2)提出多机器人协作围捕的混合强化学习方法。将强化学习系统拆分为两个学习子系统-目标追踪子系统与目标围捕子系统,以解决复杂协作围捕问题,利用模糊逻辑来解决多机器人系统状态空间大的问题,同时引入启发式奖惩函数设计的思想,以提高机器人搜索FI
3、标的效率,采用黑板通信与基于协商和意愿强化的协调方法,解决机器人之间的行为冲突,通过面向对象编程技术的仿真试验验证了上述方法的有效性。关键词:多机器人系统,强化学习,路径规划,模糊Q学习,协作围捕AbstractMulti-robotcooperationisanimportantsubjectinthefieldofrobot,whichcanfinishtaskindividualrobotcan'tdo,somorescholarsresearchonrobotcooperation.Butformulti-robotsystem,ifonlycontrollin
4、gparametersareprovided,effectivecooperationwillbedifficultlyfinished,itisawasteofresource.Tomakemulti-robotcooperationeffectiveinthecomplexandunknownenvironment,researcherspaymoreattentiontothelearningabilityofmulti-robot,aimingtooptimizeperformanceandenhancetheabilityofrobotcooperationa
5、ndeffectivelycompletethetask.Reinforcementlearningdevelopedinrecentyearsisanimportantmachinelearningmethod・11isanoptimalstrategythroughtheperceptionofenvironmentalinformation.Robothasaself-learningabilitythroughconstanttrialanderror,andinteractionwiththeenvironmenttoimprovetheirbehavior.
6、Sothemainjobofthispaperisasfollows:(1)Thispapersystematicallyanalyzedtheconceptandorganizationalbehaviorofmulti-robotsystem,whichusesthereinforcementlearningalgorithmandresearchesonthepathplanning.Throughtrialanderrorandevaluationofonlinelearning,itmakestherobotmovefromthestartingpointto
7、thetargetpointbyselectingtheoptimalpathtoobtaintherequiredplanningrulesformotivebehavior,thuslaysthetheoreticalbasisforthefurtherstudycontrolmethodsoftcooperationbehaviorofmulti-robotsystem.(2)Amixedreinforcementlearningmethodofmulti-robotcooperationhuntingisproposedinthi
此文档下载收益归作者所有