欢迎来到天天文库
浏览记录
ID:36200860
大小:309.50 KB
页数:22页
时间:2019-05-07
《f-博弈论专题-4-1混合纳什均衡》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、博弈论专题4-1混合纳什均衡一、混合策略二、混合策略纳什均衡三、应用分析一、混合策略“对硬币”博弈的例子两个参与人各握有一枚硬币,双方同时选择是正面向上(记作O)还是背面向上(记作R),即他们的策略空间都是{O,R}。若两枚硬币是一致的(即全部背面向上或者全部正面向上),参与人2赢得参与人1的硬币;若两枚硬币不一致,则参与人1赢得参与人2的硬币。博弈矩阵对硬币博弈的特征:每位参与人都想猜透对方的策略,而每位参与人又都不能让对方猜透自己的策略在“对硬币”游戏中,我们会以50%的概率选择正面(O),以50%的概率选择反面(R)。
2、像这种以一定的概率分布来选择自己策略的行为,在博弈论中称之为混合策略(mixedstrategy)。纯策略与混合策略纯策略:参与人在给定信息下只选择一种特定策略(或行动)。混合策略:参与人给定信息下以某种概率分布随机地选择不同的行动。它可以定义为策略空间(集)上概率分布。对比:智猪博弈与猜硬币博弈例:点球射门攻方的策略是:攻左边,或攻右边守方的策略是:守左边,或守右边(以守方的方向为准)守左边右边攻左边-1,11,-1右边1,-1-1,1(3)石头、剪子、布例:石头、剪子、布再看猎鹿博弈风险与均衡某种行动的概率与期望收益:猎
3、鹿?猎兔?如果猎兔的概率是0.5时,均衡是什么?0.6呢?5,53,00,33,3鹿兔子猎人2鹿兔子猎人1猎鹿博弈风险上策均衡(兔子,兔子)二、混合战略Nash均衡问题:在“猜硬币”游戏中,我们往往会以50%的概率选择正面(O),以50%的概率选择反面(R),即选择混合战略σ=(0.5,0.5)。那么有没有参与人会偏离混合战略σi=(0.5,0.5)呢?在“猜硬币”博弈中,当双方都选择混合战略σi=(0.5,0.5)时,双方的期望收益都为0。E(1O)=-1×0.5+1×0.5=0E(1R)=1×0.5+-1×0.5=0如果
4、参与人1保持混合战略σ1=(0.5,0.5),那么无论参与人2选择其它什么样的混合战略,只要参与人1保持混合战略σ1=(0.5,0.5)不变,参与人2的期望收益都为0,不会增大。也就是说,偏离并不能给参与人2带来好处。同理,偏离也不能给参与人1带来好处。因此,在“猜硬币”博弈中,双方都不会偏离混合战略组合σ=((0.5,0.5),(0.5,0.5))。像这样的混合战略组合我们称之为混合战略Nash均衡。三、混合策略应用分析(一)警察与小偷(二)监督博弈(三)社会福利博弈(一)警察与小偷某镇有一酒馆和商店,分在小镇的东西头,警
5、察不能同时兼顾两个地方。商店价值2万元,酒馆价值1万元。警察在这头时小偷会去另一头行窃,但双方到底在哪边是不确定的。双方的策略应是什么?小偷酒馆商店警察酒馆3,01,2商店2,13,0警察要使损失最小化,小偷寻求收益最大化1、如果警察以0.5的概率分别巡视两个地方,那么小偷的策略是什么?2、警察以2/3及1/3的概率分别巡视商店和酒馆,小偷该如何?3、混合纳什均衡策略是警察:P商店=2/3,P酒馆=1/3小偷:相反案例推牌九及赌场每次加倍押赌,会有什么样的结果?喝酒中的老虎、杠子、鸡、虫,有无纯策略?(二)监督博弈税收机关与
6、纳税人雇主与雇员这里,V是雇员的贡献,W是雇员的工资,H是雇员的付出,C是检查的成本。同时,我们假定HC。在这个假设下,该博弈不存在纯战略纳什均衡。求解混合战略纳什均衡得知:雇主检查的概率*=H/W,雇员偷懒的概率*=C/W。求解雇主支付W为多少时,其期望收益最大。l如果雇主能够没收雇员的抵押金F,前述两个问题的答案会发生怎样变化?如何理解这种变化?l根据上述分析,雇主是否会收取抵押金,如何收取?雇员是否愿交抵押金?l两个其它方面完全相同的企业在相互竞争中,一个收取抵押金,一个不收,说更有竞争优势?l从社会
7、福利最大化角度看,作为政府是否应禁止雇主向雇员收取抵押金?为什么?课堂讨论社会福利博弈流浪汉政府找工作游荡救济(3,2)(-1,3)不救济(-1,1)(0,0)课堂测试:求解猎人的混合纳什均衡策略。即,选择两种策略的期望收益无差异的概率。5,53,00,33,3鹿兔子猎人2鹿兔子猎人1猎鹿博弈风险上策均衡(兔子,兔子)
此文档下载收益归作者所有