3 混合纳什均衡

3 混合纳什均衡

ID:41285148

大小:403.50 KB

页数:21页

时间:2019-08-21

3 混合纳什均衡_第1页
3 混合纳什均衡_第2页
3 混合纳什均衡_第3页
3 混合纳什均衡_第4页
3 混合纳什均衡_第5页
资源描述:

《3 混合纳什均衡》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、混合纳什均衡MixedNashEquilibrium猜谜游戏1-1,-11,-11,1-1,反面正面反面正面猜谜游戏:两个儿童各拿一枚硬币,若同时正面朝上或朝下,A儿童给B儿童1分钱,若只有一面朝上,B儿童给A儿童1分钱。零和博弈博弈参与者有输有赢,但结果永远是0。没有一个战略组合构成纳什均衡2警察与小偷警察与小偷:小镇有1个警察、1个小偷银行酒馆警察小偷1万元东边西边假定:一旦小偷选择与警察相同的策略,则被逮住;否则偷窃成功;请问警察与小偷的最优策略各是什么?2万元3上述博弈特征在这类博弈中,都不存在纳什均衡。参与人的支付取决于其他参与人的战略;以某种概率分布随机地选择不同的行动每

2、个参与人都想猜透对方的战略,而每个参与人又不愿意让对方猜透自己的战略。这种博弈的类型是什么?如何找到均衡?如石头、剪子、布游戏;老虎、杠子、鸡、虫子游戏4混合策略Nash均衡警察抽签决定去银行还是酒馆,2/3的机会去银行,1/3的机会去酒馆小偷也抽签决定去银行还是酒馆,2/3的机会去酒馆,1/3的机会去银行。1-1,-11,-22,2-2,西边东边西边东边给定对方的策略一定,自己的期望支付最大/在策略之间无差异5社会福利博弈23,3-1,1-1,00,流浪救济不救济寻找工作设:政府救济的概率:1/2;不救济的概率:1/2。流浪汉:寻找工作的期望效用:1/2×2+1/2×1=1.5流浪

3、的期望效用:1/2×3+1/2×0=1.5因此,流浪汉的任何一种策略都是都是对政府混合战略的最优反应6社会福利博弈(2)23,3-1,1-1,00,流浪救济不救济寻找工作设:寻找工作的概率:0.2,流浪的概率:0.8政府:救济的期望效用:0.2×3-0.8×1=-0.2不救济的期望效用:0.2×(-1)=-0.2因此,政府的任何一种策略都是都是对政府混合战略的最优反应7混合战略纳什均衡战略/策略:参与人在给定信息集的情况下选择行动的规则,它规定参与人在什么情况下选择什么行动,是参与人的“相机行动方案”。纯战略:如果一个战略规定参与人在每一个给定的信息情况下只选择一种特定的行动,该战略

4、为纯战略。混合战略:如果一个战略规定参与人在给定信息情况下以某种概率分布随机地选择不同的行动,则该战略为混合战略。纯战略是混合策略的一种特殊情况,即概率等于0或1的情况8混合战略纳什均衡(2)混合战略:如果一个战略规定参与人在给定信息情况下以某种概率分布随机地选择不同的行动,则该战略为混合战略。9混合战略纳什均衡方法支付最大化法支付等值法由于混合战略伴随的是支付的不确定性,因此参与人关心的是其期望效用。最优混合战略:是指使期望效用函数最大的混合战略(给定对方的混合战略)在两人博弈里,混合战略纳什均衡是两个参与人的最优混合战略的组合。10混合Nash均衡:支付最大化法23,3-1,1-

5、1,00,流浪流浪汉救济不救济寻找工作即:流浪汉以0.2的概率选择寻找工作,0.8的概率选择游荡同样,可以根据流浪汉的期望效用函数找到政府的最优混合战略。政府11混合Nash均衡:支付等值法假定最优混合战略存在,给定流浪汉选择混合战略(r,1-r),政府选择纯战略救济的期望效用为:3r+(-1)(1-r)=4r-1选择纯战略不救济的效用为:-1r+0(1-r)=-r如果一个混合战略(而不是纯战略)是政府的最优选择,一定意味着政府在救济与不救济之间是无差异的。4r-1=-rr=0.223,3-1,1-1,00,救济不救济寻找工作流浪结论与“支付最大化法”是一致的。12混合Nash均衡的

6、解释对的解释:如果流浪汉以找工作的概率小于0.2,则政府选择不救济,如果大于0.2,政府选择救济,只有当概率等于0.2时,政府才会选择混合战略或任何纯战略.对*=0.5的解释如果政府救济的概率大于0.5,流浪汉的最优选择是流浪,如果政府救济的概率小于0.5,流浪汉的最优选择是寻找工作.13混合Nash均衡的解释(2)纳什均衡要求每个参与人的混合战略是给定对方的混合战略下的最优选择。因此在社会福利博弈中,,*=0.5是唯一的混合战略纳什均衡。从反面来说,如果政府认为流浪汉选择寻找工作的概率严格小于0.2,那么政府的唯一最优选择是纯战略:不救济;如果政府以1的概率选择不救济,流浪汉的最优

7、选择是寻找工作,这又将导致政府选择救济的战略,流浪汉则选择游荡。如此等等。14混合Nash均衡的解释(3)流浪汉寻找工作的概率小于0.2政府概率为1:不救济流浪汉寻找工作政府救济15猜谜游戏1-1,-11,-11,1-1,正面反面正面反面求该猜谜游戏的混合战略纳什均衡16一种简便方法:反应函数法设参与人1以p的概率选择“正”,以1-p的概率选择“反”;同样设参与人2以q的概率选择“正”,以1-q的概率选择“反”;则有:期望支付:某一策略下的支付与对应概率积

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。