基于强化学习蚁群算法的主动嗅觉

基于强化学习蚁群算法的主动嗅觉

ID:36820923

大小:4.41 MB

页数:71页

时间:2019-05-16

基于强化学习蚁群算法的主动嗅觉_第1页
基于强化学习蚁群算法的主动嗅觉_第2页
基于强化学习蚁群算法的主动嗅觉_第3页
基于强化学习蚁群算法的主动嗅觉_第4页
基于强化学习蚁群算法的主动嗅觉_第5页
资源描述:

《基于强化学习蚁群算法的主动嗅觉》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、天津大学硕士学位论文基于强化学习蚁群算法的主动嗅觉姓名:白双申请学位级别:硕士专业:检测技术与自动化装置指导教师:孟庆浩20090501摘要主动嗅觉是指应用移动机器人及气体/气味传感器主动地发现、跟踪烟羽并最终确认气体/气味源的过程。对主动嗅觉的研究在有毒、有害气体泄漏源查找,灾难营救,污染环境作业等方面有着重要的意义。与单机器人主动嗅觉相比较,多机器人主动嗅觉的气体/气味源定位效率和鲁棒性都有所提高。本文给出了基于蚁群优化(ACO)算法协调多机器人,并应用强化学习算法提高单个机器人烟羽跟踪效率的新方法。另外还对气体/气味

2、源定位过程中多机器人的探索.利用(Exploration.Exploitation.简写为E.E)平衡问题进行了探讨。具体地讲,本文围绕多机器人在有风烟羽环境下的主动嗅觉问题作了如下几个方面的研究:1.介绍主动嗅觉的基本概念及研究意义,对主动嗅觉研究现状进行总结。2.对本实验室自行研制的用于主动嗅觉研究的移动嗅觉机器人平台的软/硬’件架构进行简单介绍。3.提出一种新的烟羽跟踪方法,此算法应用AntColonyOptimization算法协调多机器人运行,同时采用强化学习算法,使单个机器人在烟羽跟踪过程中,在线学习由环境状态

3、到搜索行为的优化映射,从而使多机器人的烟羽跟踪效果得到提高。并将该算法与Charged.PSO以及Upwind.ACO算法进行仿真比较。4.根据对寻优类问题中普遍存在的E.E问题的研究,提出对多机器人烟羽跟踪过程中的E.E情况进行衡量的方法。关键词:主动嗅觉移动机器人强化学习蚁群优化算法探索.利用(Exploration—Exploitation)评估ABSTRACTActiveolfactionmeansusingmobilerobotsandonboardgas/odorsensorstofind,trackplume

4、andfinallydeclareanodorsourceactively.Researchonactiveolfactioncanbeofgreatsignificanceinlocalizationoftoxic/harmfulgasleakage,disastersalvageaswellasworkingindangeroussituations.Comparedwithsinglerobotactiveolfaction,theapplicationofmultiplerobotscanhelpenhanceth

5、eefficiencyandrobustnessofodorsourcelocalization.Inthisthesisanovelmulti.robotbasedactiveolfactionstrategy,whichutilizesAntColonyOptimization(ACO)algorithmforthecoordinationamongmultiplerobotsandatthesametime,employsReinforcementLearning(RL)algorithmtoimproveeachs

6、inglerobot’Strackingefficiency,isproposed.Additionally,theExploitation-Exploration(E-E)balanceproblemfacedbymultiple-robotsystemengaginginodorsourcelocalizationactivitiesisalsodiscussed.Thisthesisfocusesonmulti—robotactiveolfactioninwindyplumeenvironments.Therelat

7、ivelydetailedworkcanbeconcludedasfollows.1.Basicconceptsinactiveolfactionaleintroducedandthestate.of-the.artofactiveolfactioniSreviewed.2.Boththehardwareandsoftwaresystemsofsmallmobilerobotsusedforactiveolfactionarepresented.3.Anovelmulti-robotbasedplumetracingstr

8、ategywhichcombinestheACOandRLalgorithmsisputforward.TheACOisusedtocoordinatemultiplerobots,andtheRLalgorithmmakeseachrobotonlinelearnthemappingfromenvir

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。