多智能体系统的模型预测控制

多智能体系统的模型预测控制

ID:23800967

大小:2.28 MB

页数:61页

时间:2018-11-10

多智能体系统的模型预测控制_第1页
多智能体系统的模型预测控制_第2页
多智能体系统的模型预测控制_第3页
多智能体系统的模型预测控制_第4页
多智能体系统的模型预测控制_第5页
多智能体系统的模型预测控制_第6页
多智能体系统的模型预测控制_第7页
多智能体系统的模型预测控制_第8页
多智能体系统的模型预测控制_第9页
多智能体系统的模型预测控制_第10页
资源描述:

《多智能体系统的模型预测控制》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、华中科技大学硕士学位论文1绪论1.1研究背景和研究意义1.1.1分布式多智能体系统分布式多智能体系统(D-MAS,DistributedMulti-AgentSystem)是多个智能体所组成的集合,每个智能体依据其自身和邻居历史信息做出每时刻的运动决策(控制器),最终整个分布式系统达到一致性或者协同运动状态,即实现了多个个体协调行为的[1]有效控制等群集动力学行为。由于每个个体的智能性,对这种复杂的、开放系统的[2]研究是人工智能(DAI,DistributedArtificialIntelligence)一个关注的方向。作为多智能体系统行为控制探讨的重要方面

2、,个体间的协同行为和合作作业机[3-5][6]制倍受关注。在自然界中,从微小细胞、细菌到昆虫、游鱼、飞鸟的群体行为,甚至是人的群体性活动,无不表现出了高度协调的群集动力学行为,例如飞鸟的迁徙、鱼群的蜂拥等等。将这些系统的群集行为抽象成分布式多智能体系统并加以探讨和研究,对于了解自然界中诸多协同行为的内在机制以及应用于工业控制和过程运动控制具有前沿性和基础性的潜在应用价值。正因如此,分布式多智能体系统的行为协调控制机制逐渐被众多科学和工程学科专家关注,他们尝试从各自的领域对这种整体高度的群集动力学行为做出合理解释。1987年,Reynolds用一个基本的集群动力

3、学行为模型描述多智能体系统,其中智能体群体具有分离性、内聚性和排列性等特性,该模型描述了局部个体之间的通信信息交流和协同行为或一致性运动。分布式多智能体系统的研究难点在于其是一个非全局性的控制系统。传统的全局系统是基于整个系统的所有信息,这种系统在过去的若干年被广泛的研究,并且很容易在保证系统的稳定性和收敛性的前提下实现对系统的控制。然而,这种系统很难真正体现系统中每个智能体的自主性,而且会出现消耗大量的资源来获得整个系统全局信息的问题,特别在系统的组成个体数量庞大的时候尤为突出和明显。在分布式系统中,每个多智能体都能够对自己未来的行为做出决策,这些决策往往是

4、基于自身和周围少数邻居智能体的历史信息,进而最终有效实现和控制整个系统的1华中科技大学硕士学位论文协同行为。相较于全局的控制体系,分布式控制策略能够运用较少的信息交流,达到个体间的协同作业,但是,由于每个智能体分别预测、决策来获得自身的控制器,分布式系统的稳定性比较难以保证,这也使得对分布式系统的研究更有挑战性和理论上的创新性。除此之外,对分布式多智能体系统控制器设计策略的研究具有重要的现实意义[7-9]。该工作不仅能够对工业上设计自主移动的网络化系统协调控制、分布式预测和智能决策、编队协同、敏捷制造、无人艇深海探测、智能电网和车辆群体的协同作业控制具有光明的

5、应用前景,而且也可以被拓展到人类群集动力学行为的研究,通过对群集动力学系统的一致性和避障等问题的研究,可以用于人类非常规突发事件,给人类群集的恐慌拥挤踩踏行为的疏导机制研究也有良好的借鉴意义。同时,分布式多智能体系统往往被抽象成网络,这种网络化的分布式系统,在一定程度上和一些复杂网络,如社交网络、web页面链接网络相似,因此也被很多学者称为网络化的多智能体系统,其相关控制机制和策略的研究在很多方面有利于复杂网络等学科和课题的发展。1.1.2模型预测控制模型预测控制(Modelpredictivecontrol,简称MPC)也称为滚动时域控制(RecedingH

6、orizonControl,RHC),是20世纪出现的、在工业工程应用中产生重要影[10-12]响的一类先进控制方法统称。滚动优化策略是MPC算法的主要策略之一,它通过使用模型对过程输出在输入变化下的未来行为进行预测,成为区别于预先计算控制率的最优控制方法。在MPC的发展过程中,曾出现诸如模型算法控制、广义算法[10,11]控制、二次动态矩阵控制等等众多具体的控制算法。[10-12]相比于诸如PID等较为传统的控制器设计方法,MPC有很多优点。首先,它允许卡边操作,通过建立优化模型并且求解最优控制协议,加快系统的收敛速度。其次,它善于处理多变量问题,并且能够引

7、入执行器的约束,显式处理过程控制中的状态量和控制量约束。第三,方法本身具有很好的鲁棒性,能很好地克服过程控制中的耦合性、不确定性等因素。除此之外,因为预测模型具有提前预测和计算未2华中科技大学硕士学位论文来行为轨迹的功能,MPC的反馈机制可以很好地补偿模型与过程之间的预测误差,这在追踪轨迹控制中具有光明的实用前景。除此之外,通过增加额外的约束条件,MPC容易保证系统的稳定性,这在全局性的控制问题中比较明显。无论是PID还是状态反馈等控制器设计,控制率一般是偏差(或状态)的解析表达式,而常规的MPC的控制率通常与偏差(或状态)无显式的关系,是在一定优化性能指标下

8、的权衡解,这些优化指标往往是成本函数或

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。