资源描述:
《第4章 完全信息动态博弈》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第四章完全信息动态博弈更为现实的考虑是将静态博弈动态化,动态化后,纳什均衡这一概念是否仍然有效呢?答案是部分有效的。如果不存在动态不一致,那么纳什均衡在完全信息动态博弈中仍不失为一个有用的均衡概念,但纳什均衡概念本身并不能保证不出现动态不一致,为了克服这一点在纳什均衡的基础上生产了所谓子博弈完美均衡。而这一章,我们将围绕这子博弈完美均衡来展开。第一节完美信息与完全但不完美信息完全信息动态博弈可以分为两类,即完美信息与完全但不完美信息。所谓的完美信息博弈,是指博弈中的后行动者始终能够观察到前行动者的行动,因而动态博弈中不存在参与者同时行动这样的情况。而完全但不完美信息博弈,则指动态博
2、弈中,至少存在两个参与者同时行动的情况,因而“后行动者”无法观察到“前行动者”的行动。我们不妨用两个例子来加以说明。例4.1动态囚徒困境招供沉默囚徒1囚徒2囚徒2招供沉默招供沉默图4-1动态囚徒困境例4.2取消管制维持取消进退进退1图4-3取消管制政府2退进定义4.1完美信息动态博弈就是不存在同时行动的完全信息动态博弈。显然,运用策略式来描述动态博弈会非常不便,特别是当信息不完全时更是如此,为了更简便地描述动态博弈,我们将引入一种新的博弈表达式——扩展式。第二节动态博弈的扩展式现在我们将例4.1和例4.2的扩展式表达如下:第三节策略和结果策略是“万全之策”,而不再是单纯的行动,如何
3、理解这句话呢?1、动态囚徒困境中囚徒2的策略表4-1囚徒2的四个策略假如囚徒1选择招供假如囚徒1选择沉默策略1选择招供选择招供策略2选择招供选择沉默策略3选择沉默选择招供策略4选择沉默选择沉默2、蜈蚣博弈中参与者1的策略关键是理解DL,DR也是策略。所以说,策略是一个“万全之策”。定义4.3对于博弈,参与者P(h)的一个策略sP(h)(h)就是一个函数,它将每一个可能的历史h映射成行动空间AP(h)(h)中的一个行动ap(h)。上述策略的定义实际上就是指当历史进行到某个阶段时,当轮到参与者i行动时,规定了他如何行动。例如,在蜈蚣博弈中,对于参与者1而言,一个策略就是当历史为空历史时
4、,规定了参与者1如何行动,当历史为(C,C)时,规定了参与者1又如何行动,因而DL和DR就是参与者1的策略,至于历史(C,C)会不会发生那是另外一个问题,策略所要求的就是一旦出现了某个历史我应该如何做,而不能出现不知所措的情况。通过上面的说明我们看到,有什么样的策略组合就会有什么样的历史,但历史并不等于策略。为此,我们引入结果函数,即对于任意,存在某个,使得O(s)=h。参与者的收益函数u就是定义在结果上的函数。例如,在蜈蚣博弈中,可知参与者1有四个策略CL、CR、DL和DR,参与者2有两个策略C和D,因而策略组合有8个,其相应的结果函数为O(CL,C)=(CCL)u1(O(CL
5、,C))=1和u2(O(CL,C))=2;O(CR,C)=(CCR)u1(O(CR,C))=0和u2(O(CR,C))=0;O(Cx,D)=(CD)u1(O(Cx,D))=3和u2(O(Cx,D))=1;O(Dx,x)=(D)u1(O(Dx,x))=2和u2(O(Dx,x))=0。其中x代表任意行动。上面的结果函数给了我们两点启示:一是,要得到全历史实际上只需行动计划就可以了,不一定需要去考察所谓的“完全之策”,例如,O(D,x)=D=O(Dx,x)是一样的,这样做的好处是能够简化分析,但在观念上,我们必须牢记策略是“万全之策”。二是,图4-5的蜈蚣博弈实际上与图4-6中的博
6、弈完全等价,这就更为直观地指出了策略DL和DR的性质。实际上,汤普森(Thompson,1952)论证了对于任意两个等价的扩展式博弈,至少存在4种转换方式,通过转换,可以把复杂的扩展式博弈变成最简单的形式去分析。CD12(2,0)CD(3,1)图4-6与蜈蚣博弈等价的博弈(1,2)(0,0)1LRDLRC(2,0)(2,0)3、紧跟领导者(followleader)博弈的策略第四节纳什均衡与子博弈完美均衡一、纳什均衡纳什均衡概念的核心就在于,每一个参与者的策略都是给定其他参与者策略下的最优反应,并且对任意参与者成立。即便博弈是动态的,这一点也不会改变。那么,将静态博弈中的纳什均衡概
7、念运用到动态博弈中应该是一个不错的思路,尽管这样做可能存在问题。二、承诺与威胁动态博弈中会出现先行动,后行动的问题。承诺和威胁是否可信,是动态博弈中先行动的参与人是否该相信后行动的参与人选择某个行动的判断的问题。后行动的参与人所选择的行动对先行动参与人有利的,那么,后行动参与人的这一选择对先行动参与人来说是一种承诺,相反,如果不利,那么,后行动参与人的这一选择对先行动参与人来说是一种威胁。定义:一个威胁或承诺,如果发出这一信息的人执行它比不执行它花费更多的成本,则称为