资源描述:
《西经第八讲.完全信息静态博弈》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第8讲完全信息静态博弈博弈规则参与人行动支付信息知道对手的支付,但是不知道对手的行动博弈的标准型表示例如双变量矩阵囚徒2沉默招认囚徒1沉默-1,-1-9,0招认0,-9-6,-6求解博弈策略策略与行动不可区分均衡概念占优策略重复剔除严格劣策略纳什均衡占优策略在讨论均衡概念的时候,可以简写“所有其他参与人的策略”对于任何向量y=(y1,…,yn),利用表示y-i向量(y1,…,yi-1,yi+1,…,yn)。参与人i对于所有其他参与人选择的策略s-i的最优反应是策略s*i,这个策略可以为他带来最大的支付;也
2、就是:占优策略如果没有其他的策略一样好,那么最优反应是强最优,否则是弱最优。第一个重要的均衡概念基于占优这个思想。策略sdi是一个被占优策略,如果这个策略严格劣于其他某个策略,而不论其他参与人选择什么策略。从数学上看,sdi被占优,如果存在一个策略s’i满足:占优策略有的时候某个策略可以击败所有的其他策略,这种策略称为“占优策略”策略s*i是一个占优策略,如果其对于其他参与人能够挑选的所有策略都是最优反应。从数学上来看:占优策略一个占优策略均衡是一个策略组合,包含了每一个参与人的占优策略。囚徒2沉默招认囚
3、徒1沉默-1,-1-9,0招认0,-9-6,-6占优均衡因为(招认,招认)是一个占优均衡,信息结构都不发生作用。例如,两人先后行动也是这个均衡。占优均衡如果两个人可以提前交谈会怎么样?如果承诺没有约束力,结果是一样的。一些离题的话合作博弈是参与者可以制定有约束力的承诺,非合作博弈参与人无法进行这种承诺。不过这两种理论真正的区分在于建模的方法。两个理论都是开始于博弈规则,不过所用的解概念是不一样的。合作博弈是公理化的,通常用帕累托最优、公平和平等这些概念。非合作博弈是经济的,其解概念依赖于约束条件下的效用最
4、大化。一些离题的话另外一个角度,合作博弈是一种简式理论,更关注结果的性质,而不是获得结果的策略。如果为过程建模过于复杂的时候,这就是合适的方法。在应用经济学中,最经常遇到的合作博弈是讨价还价。重复剔除劣策略很少有博弈具有占优策略均衡。考虑一个俾斯麦海战问题。I将军希望选南北两条运输线路之一运送军队,K将军需要选择一个方向进行轰炸。这个博弈可以如下表示:重复剔除劣策略I将军北南K将军北2,-22,-2南1,-13,-3这个博弈没有严格占优策略。重复剔除劣策略策略s’i是弱被占优的,如果存在其他的策略s’’i
5、可能更好,不过从不会更坏。从数学上来看s’i被弱占优,如果存在s’’i使得:重复剔除劣策略我们将至少与其他策略一样好,同时好于某些策略的策略称为弱占优策略。弱占优均衡是通过剔除每个参与人所有弱被占优策略形成的策略组合。这个均衡概念对于海战博弈帮助不大。将军I可以剔除弱被占优策略-南,不过将军K就没有弱被占优策略。重复剔除劣策略重复占优均衡是一个策略组合,获得方法是剔除一个参与人的弱被占优策略,然后重新计算哪些策略是弱被占优的,剔除这些策略,重复这个过程,直到每个参与人剩下一个策略。重复剔除劣策略在海战博弈
6、中,将军K认为将军I会选择北,因为这是弱占优策略,因此,将军K在考虑中就放弃了I会选择南这个想法。从而博弈成为:将军I北K将军北2,-2南1,-1重复剔除劣策略此时,将军K就有了一个强占优策略-北。因此,策略组合(北,北)就是重复占优均衡。重复剔除劣策略我们经常考虑剔除严格劣策略。这是一个更加吸引人的想法,但是有时候不是很实用。剔除严格劣策略与剔除弱被占优策略之间存在两个区别。首先,很难支持人们为什么会剔除一些产生无差异结果的策略。在经济学模型中,参与人在均衡的时候经常是无差异的。这点在我们后面的分析中还
7、会用到。重复剔除劣策略剔除严格劣策略与剔除弱被占优策略之间存在两个区别。其次,剔除弱被占优策略存在多均衡问题。如果存在占优策略均衡,那么就一定是唯一的。如果是重复剔除严格劣策略,均衡存在的时候也一定是唯一的。剔除弱被占优策略就可能存在多均衡,因为剔除的顺序就很重要。考虑下面的博弈:重复剔除劣策略列c1c2c3行r12,121,101,12r20,120,100,11r30,121,100,13这个博弈的均衡是(r1,c1)和(r1,c3)这是因为剔除的顺序不同。分别是(r3,c3,c2,r2)和(r2,c
8、2,c1,r3)重复剔除劣策略尽管存在这些问题,剔除弱被占优策略仍然是一个有用的工具,这是一个更加复杂的均衡概念的一部分。零和博弈上面的例子是一个典型的经济学的例子。因为当一方获得好处的时候,另一方并不一定吃亏。例如,(2,12)好于(0,10)。而有些博弈,例如海战博弈,其支付结果之和永远等于零。零和博弈零和博弈是不论参与人选择什么策略,参与人支付之和等于零。非零和或者可变总和博弈其结果不是零。因为效用函数在一定程度上是自由