微分博弈理论.ppt

微分博弈理论.ppt

ID:56421237

大小:1.29 MB

页数:19页

时间:2020-06-17

微分博弈理论.ppt_第1页
微分博弈理论.ppt_第2页
微分博弈理论.ppt_第3页
微分博弈理论.ppt_第4页
微分博弈理论.ppt_第5页
资源描述:

《微分博弈理论.ppt》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、博弈论汇报人:张甲乐什么是博弈论博弈论亦称对策论,运筹学的一个分支。是研究有利害冲突的双方在竞争性活动中,如何制胜对方的最优策略的数学理论和方法。博弈论的发展史《战国策》《孙子兵法》《博弈论和经济行为》《博弈·动态规划和计算机》微分对策理论古代产生了朴素的博弈论的思想1944年美国的J·冯诺意曼和O·摩根司坦发表了巨著美国的数学家贝尔曼于1951年又发表了名著1965年埃萨克提出了在追踪问题中双方都能自由决策行动的微分对策理论发展中博弈论的基本要素构博弈论由三个基本要素成:局中人(如竞争的双方);策略(每个局中人可供选择的行动方案

2、;一局对策的得失。博弈论的基本模型博弈论最基本的模型是两人、零和对策。每一个局中人,不管他选择什么方案,另一局中人总希望使对方损失最大化,也就是每个局中人将选择使另一局中人把对方损失最大化的企图最小化的策略,这就是博弈论的最佳策略准则。纳什均衡点纳什平衡,又称为非合作赛局平衡,是博弈论的一个重要概念,以约翰·纳什命名。如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点。经典案例:囚徒困境一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被立即释放,而对方将被判刑十年;如果

3、两人均招供,将均被判刑两年。如果两人均不招供,将最有利,只被判刑半年。经典案例:囚徒困境两人同时陷入招供还是不招供的两难处境。但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳氏均衡点。这时,个体的理性利益选择是与整体的理性利益选择不一致的。鞍点(Saddlepoint)在微分方程中,沿着某一方向是稳定的,另一条方向是不稳定的奇点,叫做鞍点。在泛函中,既不是极大值点也不是极小值点的临界点,叫做鞍点。在矩阵中,一个数在所在行中是最大值,在所在列中是最小值,则被称为鞍点。在物理上要广泛一些,指在一

4、个方向是极大值,另一个方向是极小值的点。鞍点问题在证券市场上,股民们总想“在最小风险下获得最大收益”。生产着总想“在最小投入下获得最大产出”,都是这一辨证思想的体现。将这一思想用数学模型表述,己不再是单纯的极大或极小问题,而是“极大中的极小”或“极小中的极大”。在数学中,把函数上具有上述“极大一极小”性质的点称为鞍点(Sadd了lePoint)。把同鞍点有关的数学问题称为鞍点问题。形象地说,鞍点就是处于“马鞍中央的点”,从纵向看取极小值,从横向看取极大值。鞍点的含义下面用二元函数z=f(x,y)来说明鞍点的含义:对于二元函数z=f

5、(x,y),(x*,y*)为其上一点。若在邻域

6、x-x*

7、<£,

8、y-y*

9、<£内恒成立。则称(x*,y*)为函数z=f(x,y)的鞍点。鞍点具有这样的特征:当x=x*为常数,y变化时,函数f(x,y)在(x*,y*)取极小值:当y=y*为常数,x变化时,函数f(x,y)在(x*,y*)取极大值。鞍点规划(SaddlePointProgramming)鞍点具有特殊的性质,无论是理论上还是实践上,有许多问题与鞍点有关。于是一种与鞍点对应的数学规划就产生并发展起来,称为鞍点规划。所谓鞍点规划就是以寻求目标函数的鞍点为目的的一种数学规划

10、,用以解决“极大值的极小化”或“极小值的极大化”问题。鞍点规划的数学模型鞍点规划的数学模型:上述鞍点规划模型中,决策变量x,y没有加任何限制。实际上,x,y经常受到一定的约束,于是有以下约束鞍点规划问题:工程应用实例:防侧翻控制器设计它给出了一种基于微分博弈理论和进化遗传算法的防侧翻控制器设计方法。将防侧翻问题描述为一个非合作,零和,二人微分博弈模型。分别把驾驶员转向角输入和主动防侧倾杆视为扰动方和控制方。汽车前视图微分博弈模型方程(1)和(2)分别为汽车系统的状态方程和博弈的目标函数。上述方程中U(控制方)试图使L最小,而W(扰

11、动方)试图使L最大。方程(3)将这一微分博弈描述成最小最大值优化问题。L被设为在一个给定的仿真周期中,汽车侧翻角绝对值的最大值,如方程(4)所示。纳什均衡解分析可得存在纳什均衡解(u*,w*),使得鞍点不等式(5):成立纳什均衡解的含义是在最坏扰动W*(试图使L最大)工况下,最好的控制器输入是U*(试图使L最小);反之亦然。纳什均衡解其均衡解是通过进化遗传算法得到的,对进化遗传算法的适应性估计是在汽车仿真软件Carsim上进行的。进化遗传算法的适应性估计进化遗传算法流程图数值仿真及结论通过分析伯德图和在Carsim中的仿真结果,证

12、明它设计的控制器保证了在最坏的转向角输入工况下最坏防侧翻性能,同时分别通过抵抗路面扰动以及侧向加速度,提供了良好的乘坐质量以及防侧翻性能。ThankYou!

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。