欢迎来到天天文库
浏览记录
ID:36820923
大小:4.41 MB
页数:71页
时间:2019-05-16
《基于强化学习蚁群算法的主动嗅觉》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、天津大学硕士学位论文基于强化学习蚁群算法的主动嗅觉姓名:白双申请学位级别:硕士专业:检测技术与自动化装置指导教师:孟庆浩20090501摘要主动嗅觉是指应用移动机器人及气体/气味传感器主动地发现、跟踪烟羽并最终确认气体/气味源的过程。对主动嗅觉的研究在有毒、有害气体泄漏源查找,灾难营救,污染环境作业等方面有着重要的意义。与单机器人主动嗅觉相比较,多机器人主动嗅觉的气体/气味源定位效率和鲁棒性都有所提高。本文给出了基于蚁群优化(ACO)算法协调多机器人,并应用强化学习算法提高单个机器人烟羽跟踪效率的新方法。另外还对气体/气味
2、源定位过程中多机器人的探索.利用(Exploration.Exploitation.简写为E.E)平衡问题进行了探讨。具体地讲,本文围绕多机器人在有风烟羽环境下的主动嗅觉问题作了如下几个方面的研究:1.介绍主动嗅觉的基本概念及研究意义,对主动嗅觉研究现状进行总结。2.对本实验室自行研制的用于主动嗅觉研究的移动嗅觉机器人平台的软/硬’件架构进行简单介绍。3.提出一种新的烟羽跟踪方法,此算法应用AntColonyOptimization算法协调多机器人运行,同时采用强化学习算法,使单个机器人在烟羽跟踪过程中,在线学习由环境状态
3、到搜索行为的优化映射,从而使多机器人的烟羽跟踪效果得到提高。并将该算法与Charged.PSO以及Upwind.ACO算法进行仿真比较。4.根据对寻优类问题中普遍存在的E.E问题的研究,提出对多机器人烟羽跟踪过程中的E.E情况进行衡量的方法。关键词:主动嗅觉移动机器人强化学习蚁群优化算法探索.利用(Exploration—Exploitation)评估ABSTRACTActiveolfactionmeansusingmobilerobotsandonboardgas/odorsensorstofind,trackplume
4、andfinallydeclareanodorsourceactively.Researchonactiveolfactioncanbeofgreatsignificanceinlocalizationoftoxic/harmfulgasleakage,disastersalvageaswellasworkingindangeroussituations.Comparedwithsinglerobotactiveolfaction,theapplicationofmultiplerobotscanhelpenhanceth
5、eefficiencyandrobustnessofodorsourcelocalization.Inthisthesisanovelmulti.robotbasedactiveolfactionstrategy,whichutilizesAntColonyOptimization(ACO)algorithmforthecoordinationamongmultiplerobotsandatthesametime,employsReinforcementLearning(RL)algorithmtoimproveeachs
6、inglerobot’Strackingefficiency,isproposed.Additionally,theExploitation-Exploration(E-E)balanceproblemfacedbymultiple-robotsystemengaginginodorsourcelocalizationactivitiesisalsodiscussed.Thisthesisfocusesonmulti—robotactiveolfactioninwindyplumeenvironments.Therelat
7、ivelydetailedworkcanbeconcludedasfollows.1.Basicconceptsinactiveolfactionaleintroducedandthestate.of-the.artofactiveolfactioniSreviewed.2.Boththehardwareandsoftwaresystemsofsmallmobilerobotsusedforactiveolfactionarepresented.3.Anovelmulti-robotbasedplumetracingstr
8、ategywhichcombinestheACOandRLalgorithmsisputforward.TheACOisusedtocoordinatemultiplerobots,andtheRLalgorithmmakeseachrobotonlinelearnthemappingfromenvir
此文档下载收益归作者所有