欢迎来到天天文库
浏览记录
ID:36792240
大小:1.66 MB
页数:60页
时间:2019-05-15
《基于神经网络的移动机器人控制研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、摘要基于行为的移动机器人通过传感器输入和执行器输出信号的方法相互作用,产生各种“刺激.应激”行为,从而使得机器人能够利用简单的结构在变化的,无组织的环境中产生快速响应,实时性好。然而,基于行为的机器人的学习过程实际上是设计过程中的学习,而不是机器人自主运行后拥有的学习能力。由于动态环境的复杂性和不可预知性,这种没有记忆,内部表达环境和学习能力的机器人不能随着环境的变化而变化,从而缺乏对环境的适应性。为了增强移动机器人在动态环境中的学习和适应能力,本文创新性地提出了一种新的基于改进ElmaIl神经网络的具有
2、学习和记忆功能的机器人行为控制器,利用Elman神经网络特有的联接方式,使得系统不仅对当前输入的信息敏感,并且对历史输入具有敏感性,提高了系统处理动态信息的能力,加强了系统对动态环境的适应性。由于基于梯度下降BP算法的研究目前已较为成熟,所以Elrn肌神经网络权值的训练通常采用动态BP学习算法。但是由于BP算法收敛速度慢,容易陷入局部最小等缺点,本文引入遗传算法来改进权值的训练,构建了进化BP算法来训练神经网络,提高了机器人行为的准确性和快速性。在设计机器人行为时,机器人所需执行的任务和即将面临的环境都是
3、未知的,因此要求移动机器人必须具有根据环境和任务的改变,修改自身某些动作行为的能力,即具有自学习的能力。因而本文采用无教师的在线强化式学习方法控制机器人行为,设计了基于sarsa.强化学习算法的机器人避障和漫步行为的仿真试验,使得机器人的动作和行为能够符合外部环境和任务的要求。关键词:基于行为的移动机器人:EIman神经网络:进化即算法;强化学习基于神经网络的移动机器人控制研究AbstractBehavior-basedmobiIerobotcoIl仃oltig蛳1ycouplessensoryinput
4、sande丘宅cteroutputs,toallowtherobottoquicklyrespondtochallginga11duIls咖tuJ.eden啊romentsbyasimplestructureaIldhasagoodperfIomance血tIlechamcterofreal血e.However’theleamingprocessofbehavior-basedmobilerobotisa虹ndofdesigIlingleaⅡ1in岛notaself_le啪in粤Itslimi诅tions
5、includetherobot’sinabil毋tohavememory,imemalrepresentationsoftlle、vorld,ormeabilitytoleanlovertime.Therobotsareundbletochangemeiractionswithvaryingofenvironments.niscmcialtllatarobotshouldhavebotllleamingaⅡdevolutionaryabili时toadapttodynaIllicenviroIlIllen
6、ts.This廿lesisproposesanewmbotbehaviordecisioncon廿011eruSingmodmedE1manNeumlNetwork(ElmanNN).TheElmanNNhastheadvantageoustimeseriespredictioncapabilitybecauseofitsmemorynodes,as、vellaSlocalrecunentco皿ections.ThemodifiedElIllanNNcon仃ollerimDmvesnotonlvmesen
7、sibilityofllistoricaldat轧butalsotlleability0fadaptationinthedynamicenviroI皿ents.The订aillingalgorithmfortlleElmanneuralnetwOrkissimilar白theBPle啪证galgorithIn,asbothbasedont11e掣adientdescentprinciple.HoweVer’localmillimacausedbytheregularBPlearningalgo删蛐ofte
8、nresuhsinanunaVoidablyla唱eapDroxilnationerrortllatmayreduceNNpredictionaccumcv.ThereforetheGeneticAlgoritllm(GA)isin订oducedinthisthesisi11orderto叩timizationoftllewcightsinmeElmanneuralnetworkcontrollertoacllievebett
此文档下载收益归作者所有