复杂环境下的多目标动态协同对抗辅助决策方法研究

复杂环境下的多目标动态协同对抗辅助决策方法研究

ID:29144586

大小:4.28 MB

页数:94页

时间:2018-12-17

复杂环境下的多目标动态协同对抗辅助决策方法研究_第1页
复杂环境下的多目标动态协同对抗辅助决策方法研究_第2页
复杂环境下的多目标动态协同对抗辅助决策方法研究_第3页
复杂环境下的多目标动态协同对抗辅助决策方法研究_第4页
复杂环境下的多目标动态协同对抗辅助决策方法研究_第5页
资源描述:

《复杂环境下的多目标动态协同对抗辅助决策方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要摘要随着人工智能技术的飞速发展,多智能体系统在很多领域具有了广泛应用,研究多智能体相关技术就显得越加重要。同时,随着智能体结构设计技术和数据采集技术的不断完善,根据多智能体共享的环境数据进行合理的场景态势评估以及面向指定任务进行动态的协同对抗决策就成为提高多智能体作业能力和应用价值的一个重点研究方向。为了实现合理高效的多智能体态势评估与协同对抗决策,本文在多智能体系统的研究基础上,提出了一整套改进的多智能体协同对抗决策模型。希望结合该模型,多智能体系统可以实现更为合理、精准的态势信息融合与评判,并在此基础上实现动态的集群自主决策。本文主要的研究内容和创新点为:(a)设计

2、一种基于深度学习算法的态势评估方法为了实现更为合理、精准的态势评估,同时考虑到场景数据信息与态势评估结果之间的不确定对应关系,设计一种基于深度学习算法的态势评估方法(DeepLearningbasedSituationAssessment,DL-SA):首先,将场景数据统一量纲后作为深度神经网络模型输入数据,将态势标签作为输出数据;接着,按照深度学习步骤进行态势评估网络训练;最后,结合模糊理论实现态势评估结果向模糊态势向量的转换。(b)提出一种基于人工逆强化学习算法的智能决策方法为了提高决策系统对动态复杂场景的适应性和实用性,结合获取的模糊态势结果,提出一种基于人工逆强化学

3、习算法的智能决策方法(HumanInverseReinforcementLearningbasedDecision-making,HIRL-DM):首先,以模糊态势评估向量作为状态空间,进行均匀划分后获得各个状态的判定域;接着,将决策方案作为学习系统的动作集合;然后,结合BP神经网络算法和人工奖励机制实现人工逆强化学习架构设计;最后,针对半马尔科夫现象,改进累积奖励更新策略,实现一整套基于人工逆强化学习的群体协同对抗模型。(c)提出一种基于模糊控制理论的强化学习决策优化方法为了进一步提高强化学习决策方法的学习效率,减少学习时间开销,提出一种基于模糊控制理论的动态学习率调整方

4、法(FuzzyControlbasedDynamicLearningRate,FC-DLR):首先,将执行动作对环境的影响程度作为模糊控制系统的输入量,将学习率值作为输出量;然后,通过构建模糊推理引擎,实现了输入量到输出量的圆滑曲线映射并通过动态学习率实现学习性能加速;最后,在足球机器人协同对抗平台中进行实例验证,结果证明了本文方法的合理性和高效性。关键词:态势评估,协同对抗决策,深度学习,强化学习,足球机器人IAbstractAbstractWiththefastdevelopmentoftheartificialintelligencetechnology,multi-

5、agentsystemshavebeenappliedinmanyfieldsandtheresearchesonmulti-agenttechnologybecomemoreandmoreimportant.Furthermore,sincethestructuredesigntechnologyofagentsandthedataacquisitiontechnologyhavebeenmoreandmoreperfect,thereasonablesituationassessmentwiththesharedenvironmentaldataofthemultiag

6、entsandthedynamicdecision-makingforcooperationandconfrontationfacingwiththespecifictaskshavebecomeimportantstudypointstoimprovetheworkingabilityandapplicationvalueofthemultiagents.Forachievingthereasonableandefficientmulti-agentsituationassessmentanddecision-makingforcooperationandconfront

7、ation,basedonthemulti-agentsystemresearches,thispaperproposedacompletedimprovedmulti-agentdecision-makingmodelforcooperationandconfrontation.Itishopedthatwiththismodel,multiagentscouldperformthemorereasonableandaccurateinformationfusionandsituationevaluationan

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。