基于增强学习和art2神经网络的移动机器人路径规划研究

基于增强学习和art2神经网络的移动机器人路径规划研究

ID:32467908

大小:1.93 MB

页数:79页

时间:2019-02-06

基于增强学习和art2神经网络的移动机器人路径规划研究_第1页
基于增强学习和art2神经网络的移动机器人路径规划研究_第2页
基于增强学习和art2神经网络的移动机器人路径规划研究_第3页
基于增强学习和art2神经网络的移动机器人路径规划研究_第4页
基于增强学习和art2神经网络的移动机器人路径规划研究_第5页
资源描述:

《基于增强学习和art2神经网络的移动机器人路径规划研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、卜海大学博士学位论文摘要本文在增强学习S[IART2神经网络的基础上,研究了移动机器人路径规划问题,并重点分析了路径规划中的避碰撞问题。本文主要的工作和创新点有以下三个方面:(1)首先针对增强学习中的策略问题,提出了一种渐进式Soft.MaxjT为选择策略;即在学习初始时,因为对行为掌握的经验知识不够,学习主要通过探索以得到行为的经验知识:在学习的后期则因积累了足够多的经验知识,可以更好地利用行为,同时也可以通过某种突变以达到加快或减慢学习速度的目的。其次针对连续性任务,提出了~种连续任务On—Policy增强学习方法S—Leaming以及基于最先策略的增强学习方法FPRL(Fo

2、remost—PolicyReinforcementLearning),并在仿真实验中与传统的Q-Learning方法进行对比,以说明这两种增强学习方法的可行性。(2)为了解决增强学习中传统的策略查询表(100kup.table)不适合存储大量的状态值和行为值的问题,本文采用ART2}d0经网络存储大量的状态空间和分类模式。面对大量的分类模式,手工评估和选择分类模式是非常困难的,为此本文在ART2;冲经网络中引入增强学习评估和选择机制,结合成RL—ART2(ReinforcementLearningbasedART2NeuralNetwork)神经网络,成功地解决了如何评估和选择

3、己存储在ART2中的分类模式的问题。(3)提出了基于RL-ART2神经网络的移动机器人多障碍物避碰撞系统RLART2一CAS(RLART2一CollisionAviodanceSystem)。为了解决多障碍物环境下,难于手工获取避碰撞规则的难题,本文采用增强学习的方法使系统可以自主获得避碰撞规则;采用RL.ART2神经网络,实现了增强学习和神经网络的集成,解决了规则存储需要占用大量内存空间的问题,并自动评估避碰效果,使系统能够通过学习获得理想的避碰行为,完成路径规划。关键词:增强学习、ART2神经网络、移动机器人、避碰撞、路径规划V卜阿人学博一L学位论文ABSTRACTBased

4、onthereinforcementlearningandART2neuralnetwork,thepaperdoestheresearchonthepathplanningproblemofmobilerobotandanalyzestheproblemofcollisionavoidanceofthepathplanning.Theinainworkandcreativepointsofthepaperareasfollows:(1)Firstly,thepaperpresentsanactionselectingpolicynamedgradualSoft.MaxtOslo

5、vetheproblemofselectingpolicyinreinforcementlearning.ByusingthegradualSoft_Max,theagentcanexploretoacquiremoreactionexperienceinthebeginningoflearningandexploittheactionsintheanaphaseoflearningduetoaccumulatingenoughactionexperience.ItalsocanmakeabreaktoaccelerateorslowerthelearningspeedMeanw

6、hile,thispaperpresentsareinforcementlearningmethodnamedS-Learningforcontinuingtaskandalearningmethodbasedonforemost-policynamedFPRL(Foremost—PolicyReinforcementLearning).(2)ThepaperusesART2tostoreabundantclassifypatternsandstatespaceinordertosolvetheproblemthatthetraditionallookup—tabledoesn’

7、tadapttostoregreatamountsofstateandactionvaluesWecombinethemechanismofselectionandevaluati011inreinforcementlearningwiththeART2asRL—ART2(ReinforcementLearningbasedART2NeuralNetwork)tosolvethedifficultiesofevaluatingandselectingthestoredclassi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。