欢迎来到天天文库
浏览记录
ID:51965796
大小:2.18 MB
页数:89页
时间:2020-03-26
《博弈论与经济全套配套课件于维生 第2章 纳什均衡.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第2章纳什均衡2.1纳什均衡的定义纳什均衡是博弈论中最重要的概念,各种非合作博弈模型的均衡概念都是建立在纳什均衡基础之上的。纳什均衡是个策略组合,它满足两个要求。1.对每个局中人,能够预期到对手采用策略组合。2.对每个局中人,是他应对的最好的策略。纳什均衡的定义定义2.1设为一具有完全信息的策略型博弈模型,称策略组合为G的一个纳什均衡。如果对是在i的对手策略组合为条件下局中人i的最优反应策略,即或对。如果以上不等式对严格成立,称为G的严格纳什均衡。在完全信息静态博弈中可用纳什均衡预测每个参与人的策略,进而预测我们所关心的各种博弈结果。扩展型博弈模型的纳什均衡定义为它所对应的策
2、略型博弈的纳什均衡。例2.1囚徒困境问题在例1.6给出的囚徒困境问题中,是惟一的严格纳什均衡。策略组合都不是纳什均衡。例2.2伯川德(Berchand)均衡设有生产同质产品的两个企业,同时独立地确定产品的价格。已知该产品市场需求函数为,满足。这里q代表产量,p代表价格。两个企业具有相同的单位成本.企业的利润函数如下:这里表示两个企业的价格分别为时,市场对于企业的产品的需求量。上述企业价格竞争问题可以归结为完全信息静态博弈模型其中局中人集合。策略集合表示企业所有可行价格构成的集合。支付函数。为求该模型的纳什均衡,可先将策略组合集合中的点分为4类,分别讨论它们是否能构成纳什均衡。
3、第1类,第2类,第3类,第4类,(1)当,不是纳什均衡。.(2)当,不是纳什均衡。(3)当,不是纳什均衡。(4)当,是纳什均衡。称其为伯川德均衡。例2.3简单产品差异化模型考虑由商店构成的市场,A与B分别销售不同品牌的商品,进行价格竞争。假设生产的单位成本为零。消费者分为两类,个消费者偏好于产品A,个消费者偏好于产品B。A,B两种品牌价格分别为。设消费者可从A或B处购买单位商品。用表示由于购买不喜欢的产品所付出的厌恶成本,假设消费者具有如下的效用函数用表示消费者对于产品A的需求量;表示消费者对于产品B的需求量。则可以证明上述产品的差异化模型不存在纳什均衡。纳什均衡的不变性由纳
4、什均衡的定义知,为纳什均衡的充要条件是对任何参与人支付差,而与这个差值是多少无关,由此可导出纳什均衡的一个性质:纳什均衡的不变性命题2.1设为已知策略型博弈。(1)纳什均衡在支付函数的正仿射变换下不变。对,令,其中,则G与有相同的纳什均衡。(2)纳什均衡在支付函数的局部变换下不变。给定及.令,G与有相同的纳什均衡。重复剔除被严格占优策略均衡与纳什均衡的关系命题2.2若是有限策略型博弈的纳什均衡,那么它不会被重复剔除被严格占优策略的过程所剔除。命题2.3在有限策略型博弈中,如果是重复剔除被严格占优策略均衡,则它必为纳什均衡。2.2求纳什均衡的划线法划线法对于二人有限博弈,,G可
5、由支付矩阵给出。设为G的纳什均衡。即是局中人2对于的最优反应,是局中人1对于的最优反应。G的纳什均衡可由以下划线法求得。1.对局中人1的每个策略,寻找局中人2的最优反应。若最优反应为,即,则在支付矩阵元素下划一短线。2.对局中人2的每个策略,寻找局中人1的最优反应,若最优反应为,即,则在元素下划一短线。3.如果支付矩阵中元素的每个分量都划有短线,这表明,是关于的最优反应。也是关于的最优反应,故,策略组合为G的纳什均衡。例2.4在囚徒困境问题中,其支付矩阵为应用划线法,支付矩阵中的元素(-5,-5)下都划上了短线,其所对应的策略组合为纳什均衡,且是严格的纳什均衡,例2.5斗鸡博
6、弈两个人举着火棍从独木桥的两端走向中央进行火拼,每个人都有两种战略:继续前进,或退下阵来。若两个人都继续前进,则两败具伤;若一方前进,另一方退下来,前进者胜利,退下来的丢了面子;若两人都退下来,两人都丢面子,支付矩阵如下:用划线法可得严格纳什均衡(退,进),(进,退)。例2.6智猪博弈猪圈里圈着两头猪,一头大猪,一头小猪。猪圈的一边有一个猪食槽,另一边安装一个按钮,按一下按钮会有10个单位的猪食进槽。但谁按按钮就需要付2个单位的成本。若大猪先到,大猪吃到9个单位,小猪吃到1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位,支付矩阵如
7、下。严格纳什均衡为大猪“按”,小猪“等待”。例2.7在例1.8中的大堤维护博弈中,支付矩阵为利用划线法可得纳什均衡(维护,维护),(不维护,不维护)。为了保护生命财产的安全,政府可以立法,如果参与人不维护大堤,需付罚款5,则有支付矩阵这时该博弈有惟一的纳什均衡(维护,维护)。2.3最优反应映射与纳什均衡定义2.2局中人的最优反应映射局中人i的最优反应映射是一个定义于策略组合集合S,取值于策略集的子集的集值映射(映射值为集合的映射称为集值映射),,满足定义2.2表明,局中人i的最优化反应映射仅与有关。反应
此文档下载收益归作者所有