混合的策略纳什均衡PPT课件.ppt

混合的策略纳什均衡PPT课件.ppt

ID:59237205

大小:405.50 KB

页数:34页

时间:2020-09-22

混合的策略纳什均衡PPT课件.ppt_第1页
混合的策略纳什均衡PPT课件.ppt_第2页
混合的策略纳什均衡PPT课件.ppt_第3页
混合的策略纳什均衡PPT课件.ppt_第4页
混合的策略纳什均衡PPT课件.ppt_第5页
资源描述:

《混合的策略纳什均衡PPT课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、混合策略纳什均衡MixedStrategyNashEquilibrium理学院顾聪gucongyeah9/4/20211两个参与人各拿一枚硬币,并选择出正面向上还是反面向上。若两枚硬币是一致的(即全部正面或全部反面),则参与人2赢走参与人1的硬币;若两枚硬币不一致(一正一反),参与人1赢得参与人2的硬币。支付矩阵如下:参与人1参与人2-1,11,-11,-1-1,1正面反面正面反面由划线法可知,该博弈不存在纳什均衡。所以采取纯策略不存在稳定的纳什均衡解。4.1严格竞争博弈和混合策略1.混合策略的提出——猜硬币博弈9/4/20212在这类博弈中,不存在纯策略纳什均衡。参与人的

2、支付取决于其他参与人的策略;以某种概率分布随机地选择不同的行动。每个参与人都想猜透对方的策略,而每个参与人又不愿意让对方猜透自己的策略。这种博弈的类型是什么?如何找到均衡?上述博弈的特征是:9/4/20213策略:参与人在给定信息集的情况下选择行动的规则,它规定参与人在什么情况下选择什么行动,是参与人的“相机行动方案”。纯策略:如果一个策略规定参与人在每一个给定的信息情况下只选择一种特定的行动,称为纯策略,简称“策略”,即参与人在其策略空间中选取唯一确定的策略。混合策略:如果一个策略规定参与人在给定的信息情况下以某种概率分布随机地选择不同的行动,称为混合策略。参与人采取的不

3、是明确唯一的策略,而是其策略空间上的一种概率分布。2.混合策略、混合策略博弈和混合策略纳什均衡9/4/20214混合策略vs.纯策略(不确定性vs.确定性)在博弈中,博弈方的策略空间,则博弈方以概率分布随机在其个可选策略中选择的“策略”,称为一个“混合策略”,其中对都成立,且纯策略可以理解为混合策略的特例,即在诸多策略中,选择该纯策略的概率为1,选其他纯策略的概率为0.为何参与人可能会选择带不确定性的混合策略而放弃确定性的纯策略?参与人主观因素造成的犹豫不决外在客观因素的不确定性带来应对策略的不确定性迷惑对手:为了让其它参与人不能清楚了解自己的选择9/4/20215混合策略

4、扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈”。混合策略纳什均衡(MNE):由最优的混合策略构成的混合策略组合:9/4/20216对于任意混合策略组合:若各参与人最终确定的组合(纯策略组合)为参与人的支付为发生此情况的概率为参与人的期望效用:3.期望效用(ExpectedPayoff)9/4/20217由于混合策略伴随的是支付的不确定性,因此参与人关心的是其期望效用。最优混合策略:是指在给定对方的混合策略的情况下,使期望效用函数最大的混合策略。在两人博弈里,混合策略纳什均衡是两个参与人的最优混合策略的组合。9/4/2

5、021823,3-1,1-1,00,流浪流浪汉政府救济不救济寻找工作虽这模型没有PNE,却有下述的MNE:参与人以一定的概率选择某种策略,然后计算相应于不同概率的期望效用。4.一个例子——社会福利博弈9/4/20219设:政府救济的概率θ=1/2;不救济的概率1-θ=1/2。流浪汉寻找工作的期望效用:1/2×2+1/2×1=1.5流浪的期望效用:1/2×3+1/2×0=1.53,2-1,3-1,10,0救济θ不救济1-θ寻找工作γ游荡1-γ此时,流浪汉选择任何混合策略的期望效用都是1.5,则流浪汉的任何一种策略(纯的γ=1或γ=0或混合的0<γ<1)都是政府所选择的混合策略

6、的最优反应。9/4/2021103,2-1,3-1,10,0救济θ不救济1-θ寻找工作γ游荡1-γ而当γ=0.21-γ=0.8游荡寻找工作如果流浪汉选择这个混合策略,政府的任何策略(混合的或纯的)带给政府的期望效用为-0.2。特别的,以1/2的概率分别选择救济和不救济当然也是政府对于流浪汉所选择的混合策略的最有反应。这样,我们得到一个混合策略组合,每一个参与人的混合策略都是给定对方混合策略是的最优选择,从而构成混合策略纳什均衡。策略期望收益政府(0.5,0.5)-0.2流浪汉(0.2,0.8)1.59/4/202111既然参与人在构成混合策略时选择不同纯策略之间是无差异的,

7、他为什么不选择一个特定的纯策略而要以特定的概率随机地选择不同的纯策略呢?一个参与人选择混合策略目的是给其他参与人造成不确定性。海萨尼(Harsanyi,1973)对混合战略的解释是,混合策略均衡等价于不完全信息下的纯策略均衡:如社会福利博弈中,假定有两类特征的流浪汉,一类选择寻找工作,另一类选择游荡;每个流浪汉都知道自己的特征,但政府并不知道流浪汉的准确特征,只知道流浪汉20%概率属第一类,80%概率属第二类。在这种情况下,政府在选择自己的策略时似乎面临的是一位选择混合策略的流浪汉。支付最大化法支付等值法最优反应函

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。