资源描述:
《《博弈论混合策略》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、博弈论GameTheory蔡树彬shubin@szu.edu.cn13510646162(66162)科技楼14062第7讲连续策略基本定义:划拳博弈支付均等化:小偷与守卫导数法:政府救助BR函数法:性别大战3划拳博弈锤剪包锤剪包0,01,-1-1,1-1,10,01,-11,-1-1,10,0121.写出1和2所有的最佳应对:BR1(锤2)=包1….2.在上面的矩阵里把相应的最佳应对画上圈,这个博弈有没有占优策略?有没有Nash均衡策略?3.使用箭头的方法再次寻找均衡4.假如是你来玩这个游戏,你将如何来玩这个游戏?4不存在Nash均衡,如何应对?假定对方是个高手,你
2、愿意和他一局定胜负还是5局3胜?假定对方是个低手呢?假定5局3胜,对手“包包包包包”,你有什么策略获胜?假定5局3胜,对手“包包剪包包”,你有什么策略获胜?假定5局3胜,对手“包包锤剪包”,你有什么策略获胜?假定5局3胜,你知道对手会出3包1锤1剪,但是不知道顺序,你有什么策略获胜?假定3局2胜,你知道对手会出1包1锤1剪,但是不知道顺序,你有什么策略获胜?假定1局定胜负,你知道对手喜欢出包,你有什么策略获胜?假定1局定胜负,你知道对手随便乱出拳,你有什么策略获胜?5划拳博弈锤1剪2包3锤1剪2包30,01,-1-1,1-1,10,01,-11,-1-1,10,012
3、取胜关键:不能让另一方猜到自己的策略尽可能猜出对方策略6混合策略的提出利用生活经验不难知道,为了获胜,不能让对手知道自己要出什么,所以要用随机的方法来出拳,而且要等概率(为什么?)在这个例子里,A的策略是(1/3锤,1/3剪,1/3包)这就引出了用概率来确定采用何种策略的方法,这就是混合策略(mixedstrategies)概念的由来在此之前所说的策略,实质上是以概率1选取某个确定的策略或行动,我们称之为纯策略(purestrategies)7混合策略的提出博弈G={N,Ai,ui,i∈N}参与人i的纯策略构成的策略集合为Si=Ai={si1,…,sik},参与人i有
4、j个不同的策略混合策略:若参与人i以概率分布pi=(pi1,…,pik)在其k个可选策略中随机选择“策略”0≤pij≤1,对于j=1,…,k都成立pi1+…+pik=1纯策略可看成特殊的混合策略8混合策略意义下的相关表述混合策略空间:(pi1,…,pik)(si1,…,sik)T混合策略意义下策略组合的表述{x1∈X1,…,xn∈Xn},其中Xi,i=1,…,n表示参与人i的混合策略空间,xi为参与人i的一个具体混合策略9纳什均衡的存在性问题每一个有限博弈至少存在一个纳什均衡(纯策略或混合策略);如果一个博弈存在两个纯策略纳什均衡,那么,一定存在第三个混合策略纳什均衡
5、10为什么要不能严打加大打击力度加大处罚力度(多判死刑)加大酒驾的惩罚力度猎虎行动11小偷和守卫的博弈小偷和守卫的博弈V,-D-P,00,S0,0睡不睡偷不偷守卫小偷这个博弈的均衡是什么?概率是多大?加重对小偷的处罚会有什么结果?(增大P值)加重对守卫的处罚会有什么结果?(增大D值)12支付均等化如果对手猜出自己的行为,则自己必败为了不让对手猜出自己的行为,必须以一定概率选择纯策略该概率的选择使得每种纯策略带来的支付都相等,所以不会偏向任何一种策略13支付均等化小偷以θ的概率偷,守卫以γ的概率睡觉V,-D-P,00,S0,0睡不睡偷不偷守卫小偷14理解混合策略1。参与
6、人随机做出某种行为(偷或者不偷)2.有许多参与人,每个人的行为是确定的,但是大家在一起表现出统计特征3.参与人是确定行为,但是对其他人来说是随机的。守卫随机抽取一人,并不能确定该人是偷还是不偷15V,-D-P,00,S0,0睡不睡偷不偷守卫小偷加重对小偷的处罚:短期内能抑制盗窃发生率长期并不能降低盗窃发生率,但会是的守卫更多的偷懒0-P-P’小偷得益(偷)VPg守卫睡的概率116V,-D-P,00,S0,0睡不睡偷不偷守卫小偷加重对守卫的处罚:短期效果是使守卫更尽职但长期中并不是使守卫更尽职,而是会降低盗窃发生的概率0-D-D’守卫得益((睡)SPt小偷偷的概率117
7、如何使失窃率下降?加大对小偷的处罚只会一时改善治安长期作用是使监管者更懒惰加大对守卫的处罚短期使守卫更尽职长期是使偷窃率下降如何治理贪污?加大对贪官的处罚力度?加大对纪委的处罚力度不能头痛医头,脚痛医脚加大酒驾的惩处力度,只会使执法者更懒,不会制止酒驾要制止救驾,就要加大对警察的惩罚力度,使得警察增大查处的概率物价降不下来?不能只是处罚供应商,不能只是约谈。要加大对发改委的惩处力度(干不好就下去)引咎辞职18救助的困境被救助者在老家盖房子汶川的救助物资现在都没用(救助款更不知道到哪里去了)郭美美事件救助会不会养懒汉?为治疗某个病人的捐款常在治好病之后