多智能体论文:多智能体强化学习协作协商联合博弈

多智能体论文:多智能体强化学习协作协商联合博弈

ID:41653746

大小:56.59 KB

页数:5页

时间:2019-08-29

多智能体论文:多智能体强化学习协作协商联合博弈_第1页
多智能体论文:多智能体强化学习协作协商联合博弈_第2页
多智能体论文:多智能体强化学习协作协商联合博弈_第3页
多智能体论文:多智能体强化学习协作协商联合博弈_第4页
多智能体论文:多智能体强化学习协作协商联合博弈_第5页
资源描述:

《多智能体论文:多智能体强化学习协作协商联合博弈》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、多智能体论文:联合博弈框架下的多Agent强化学习算法研【屮文摘要】多智能体系统是一个复杂的动态系统,系统中问题求解空间巨大,是人工智能领域研究的一个热点问题。智能体系统的一个主要特征是能够适应未知环境,其中学习能力是智能体系统的关键技术之一。针对单Agent系统对环境仅部分感知、搜索空间巨大、学习效率不高等缺点,本文在综合多种学习算法的基础上作了以下工作:首先引入了多智能体学习的一些理论知识,对强化学习和多Agent强化学习的研究现状和未来发展方向进行了阐述,介绍了目前常用的强化学习基本原理和使用的基本模型,探讨了强化学习中儿种经典算法,在实验分

2、析的基础上讨论了各参数对经典的强化学习算法的影响。在对口治协商模型的结构、原理,以及协商僵局的成因、对协商效用影响进行分析的基础上,利用基于博弈论的提议策略改进了原有的双边-多议题协商模型,采用Q学习算法对双边多议题协商过程中出现的僵局进行消解,支持多Agent系统在协商过程中的学习。实验表明,所建模型是可行和有效的。针对多Agent联合学习问题,提岀了基于联合博弈的多Agent强化学习算法。该算法以成员联合博弈为理论框架,用长期冋报矩阵对多个阶段的结果进行评估,使得联合行为的好坏程度得以准确表示;通过对多最・・・【英文摘要】MASiscurren

3、tlyahotresearchfieldofartificialintelligenee,whichisacomplex,dynamicenvironment・Problemsolvingsystemishuge・Oneofthemainfeaturesofintelligentsystemisabletoadapttounknownenvironments,wherelearningisthekeytechnologyofintelligentsystems.Accordingtothefeedbackofdifferent1earningtec

4、hnologies,machine1earningcanbedividedintosupervisedlearning(Supervisedlearning),non-supervisedlearning(Unsupervisedlearning)andreinforcementlearning(Re...【关键词】多智能体强化学习协作协商联合博弈【英文关键词】MasReinforcementLearningCollaborativeConsultationUnited-Game【索购全文】联系aQ1:138113721®Q2:139938848同

5、时提供论文写作一对一辅导和论文发表服务•保过包发【目录】联合博弈框架下的多Agent强化学习算法研究摘要3-4ABSTRACT4-5第一章绪论8-121.1研究口的及意义8-91・2协商框架研究现状91・3强化学习研究现状9-101・4论文研究的主要内容及创新点10-111.5论文整体结构11-12第二章相关理论研究12-242.1强化学习理论研究12-142.2多Agent强化学习基本理论14-162.2.1多Agent强化学习基本模型14-152.2.2多Agent学习系统的组成要素15-162.3多AGENT强化学习的主要算法16-202.3

6、.1动态规划方法16-172.3.2吋间差分算法172.3.3Q学习算法17-202.3.4基于角色跟踪的强化学习算法202.4强化学习算法分析20-222.4.1学习率Q对强化学习算法的影响20-212.4.2学习策略对强化学习算法的影响21-222.5本章小结22-24第三章多Agent协商模型框架24-383.1理论基础243.2双边多议题自治协商模型24-293.2.1BNM的形式化描述24-253.2.2效用评价机制-K253.2.3学习机制一L25-263.2.4提议策略-S26-293.3协商模型优化设计29-343.3.1协商协议2

7、9-313.3.2僵局消解过程算法设计31-323.3.3基于Q学习的僵局消解设计32-343.4算法分析34-373.4.1实验场景描述353.4.2可收敛性35-363.4.3有效性36-373.5本章小结37-38第四章基于联合博弈的多Agent强化学习38-504.1多AGENT协作学习的联合博弈框架38-434.1.1基木概念38-404.1.2基于联合博弈的多Agent强化学习算法40-424.1.3算法实现42-434.2调度问题的描述43-494.2.1任务调度问题的研究现状分析44-454.2.2协同设计任务调度问题描述45-46

8、4.2.3应用实例与分析46-494.3本章小结49-50第五章总结与展望50-525.1论文总结505.2进一步工作50

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。