欢迎来到天天文库
浏览记录
ID:32467925
大小:1.41 MB
页数:84页
时间:2019-02-06
《基于多层强化学习的多机器人团队协作》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、上海交通大学硕士学位论文基于多层强化学习的多机器人团队协作姓名:叶道年申请学位级别:硕士专业:控制理论与控制工程指导教师:陈卫东20060201基于多层强化学习的多机器人团队协作摘要随着机器人领域研究的深入当前机器人学的研究重点已经转向在自然环境中具有机动能力和一定智能的移动机器人移动机器人吸引了大量研究者的注意有着越来越重要和广泛的应用前景任务也随之越来越复杂单个机器人已经不能满足任务的需要于是多机器人系统的研究引起了越来越多的关注多机器人系统不是简单的将单机器人机械的组合如何有效实现多机器人有效的协调与合作是多机器人系统研究的重要问题如果采用传统控制
2、方法达到这个目的无论从编程实现还是考虑协调与协作的规则都是十分庞大的工程因此需要一种自动化的手段让机器人自动学习并适应环境有效协调控制整个系统学习与智能的产生和发展全过程紧密相连通过学习改善和发展行为能力是智能的本质特征也是对人工智能和机器人学的终极挑战本文提出的多层强化学习思路应用在仿真平台实验及真实机器人实验中较好的实现了多机器人的团队协作表明了该算法的有较强的适用性和通用性为以后将该方法应用到实际机器人奠定了一定基础论文首先对多移动机器人智能学习的研究现状进行简单的论述并对多移动机器人团队协作系统的特点体系结构进行简要的概述接下来在简介强化学习现状
3、和背景之后介绍了强化学习方法基本概念算法原理及其基本结构详细论述了多种强化学习算法以及多机器人团队协作的几种常见任务第三章主要对基于多层RL的强化学习进行了仿真实现在简介仿真软件之后阐述了采用单层RL所面临的问题从而提出了采用多层的原因和思路随之进行了详细的多层RL仿真实验设计和仿真结果分析第四章在介绍真实RL实验平台之后本文设计了真实机器人的强化学习实验任务对任务进行了具体的实验设计并针对真实实验结果进行了处理和分析本论文的课题是国家自然科学基金资助项目有着很重要的研究价值随着机器人系统的不断扩大协作行为是必需的研究如何实现多机器人团队协作任务的自我学
4、习和自我组织以形成环境到动作的理性映射策略变得越来越重要这一技术将会得到越来越广泛的研究和推广同时该领域的研究工作也将对机器人的实际应用具有十分积极的推动作用关键词多机器人团队协作行为多层强化学习动作映射COOPERATIONOFROBOTTEAMBASEDONMULTI-LAYEREDREINFORCEMENTLEARNINGABSTRACTWiththedevelopmentofthesocietyandtechnology,aswellasthedevelopmentofrobottechniquesandtheextensionofrobotap
5、plications,robotshasattractedmuchmoreattentionsinsomefieldswhererobotcanbeapplied.Withtheextensionofapplications,thetasksforrobotsbecomemoreandmorecomplex,andit’sreasonabletoapplymulti-robotinsteadofthesinglerobotinmanyfields.Ifadopttraditionalcontrolmethodtoachievethis,Itwillbea
6、hugeprojectwhichit’shardtofinish.Inordertocoordinatethewholesystemeffectively,itismoreandmoreimportanttodevelopanddesignmethodstomakerobotslearnandadapttheenvironmentsautomatically.Thisthesismainlyfocusesonthemulti-layeredreinforcementlearningalgorithmsinmulti-robotsystems.Inaddi
7、tion,theefficiencyofthealgorithmsisalsoverifiedbycomputersimulationsandsinglerealrobotexperiment.Inthisthesis,theresearchstatusofthegroupbehaviorofmobilerobotsisintroducedbrieflyatfirst.Soaretheircharacteristicsandsystemarchitectures.Thenweintroducereinforcementlearningtheoryandi
8、tsbasicstructureafterbriefintroductionab
此文档下载收益归作者所有