强化学习及其在智能仓储中的应用研究

强化学习及其在智能仓储中的应用研究

ID:35077519

大小:5.72 MB

页数:66页

时间:2019-03-17

强化学习及其在智能仓储中的应用研究_第1页
强化学习及其在智能仓储中的应用研究_第2页
强化学习及其在智能仓储中的应用研究_第3页
强化学习及其在智能仓储中的应用研究_第4页
强化学习及其在智能仓储中的应用研究_第5页
资源描述:

《强化学习及其在智能仓储中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、研究生毕业论文(申请硕壬学位)论文题目强化学习及其在智能仓储中的应用研究作者姓名窦佳佳控制王程专业名称研究方向智能信息处理与智能系统指导教师陈春林副教授2016年5月I学号:MF1315011论文答辩曰期:。巳年>月曰3/指导教师:(签字)萨朵林ReinforcementLearninandthealicationtogppIntelligentWarehousing乂DissedationSubmittedtoNaninUniversitjgyFo

2、rthePro化ssionalDereeofMasterofEnineeringggBYDOUJiaiajSupervisedbyAssociateProfessorCHENChunlinSchoolofManagementand£ogi打eeringNaninUniversitjgyMay2016南京大学学位论文原创性声明,本人郑重声明:所呈交的学位论文是本人在导师的指导下,独立进行研究工作所取得的成果。尽我所知,,除文中已经注明引用的内容外本论文不包含任何其他个人或集体已

3、经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体。,均已在文中明确方式说明并且表达了谢意研究生签名传日期:南京大学学位论文使用授权声明本学位论文作者同意学校保留并向国家有关部口或机构送交学位论文的复、。印件和电子文档,可W采用影印缩印或扫描等复制手段保存论文本文电子文一档的内容和纸质论文的内容相致。除在保密期内的保密论文外,允许论文被查阅和借阅,可W公布(包括刊登)论文的全部或者部分内容。论文的公布(包括刊登。)授权南京大学研究生院办理导师签名::;f本研究生签名曰期/批南京大学硕±学位论文摘要

4、南京大学研究生毕业论文中文摘要首页巧纸毕业论文题目:强化学习及其在智能仓储中的应用研究控制工程专业2013级硕壬生姑違:窦佳佳、指导教师(姓冶职称):陈春林副教授摘要智能仓储是物流行业不可或缺的重要环节,商效灵敏的智能仓储对提高仓储的工作效率具有至关重要的作用。本文主要探讨强化学习及其在智能仓储中的应用研究。采用强化学习机制的智能体不需要任何先验知识,智能体不会被告知采""取何种行为,而是通过与环境试错的方式进行自主学习,学习最优行为策略。一为了提高智能仓储系统的整体效率,本文提出了种新的组合解决方案

5、。该方案分别采用遗传算法进行机器人之间的任务分配,运用强化学习进行路径规划。强化学习对于未知环境下的路径规划问题具有很强的自主学习能力。遗传算法是一种通过模拟自然界生物进化的方式来求解问题的随机搜索方法,它使用简单的编码技术和繁殖机制来表示复杂的现象。采用遗传算法进行多机器人之间的任务分配,能获得非常好的效果。本文将这两种算法进行组合使用,为智能仓储的经典问题路径规巧和任务分配提供了可行方案。仿真实验将其与相同领域的先进算法进行比较,结果证明,这个组合方法显著减少了机器人执行任务的总时间,有效地提高了仓储系统的运行效率。

6、在多智能体强化学习系统中,巧境在所有智能体的联合动作下进行状态的迁移。智能体在选择动作时,可能会受到其他智能体的影响。在这种情况下,研究环境的联合状态和智能体的联合动作是非常必要的。多智能体强化学习系统具有开放巧和动态性,为了降低系统的计算复杂度,提高学习效率,本文采用基于稀-疏交互的CQleaming算法来求解智能仓储中多机器人路径规划问题。同时,在机器人学习过程中,引入迁移学习机制,即利用先前机器人已经学到的知识来促一个机器人的学习过程进另。由于获得了环境信息,机器人学习时能有效提高初I南京大学硕±学位论文摘要

7、-始阶段的学习效率,从而加快算法的收敛速度。仿真实验证明,改进的CQleaming算法在多机器人路径规划中是有效的。关键词:强化学习;智能仓储;路径规划;任务分配;稀疏交互;迁移学习II南京大学硕±学位论文ABSTRACT南京大学研究生毕业论文英文摘要首页用纸THESIS:ReinforcementLeamin泛and化eapplicationtoIntelligentWarehousingSPECIALIZATION:ControlEngineeringPOSTGRADUATE:DO

8、U化aUaMENTOR:AssociateProfe巧orCHEN

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。