欢迎来到天天文库
浏览记录
ID:7290919
大小:168.63 KB
页数:9页
时间:2018-02-10
《博弈与社会重复博弈与信誉》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、序惯博弈与重复博弈•序惯博弈(sequentialgame):参与人在前一个决第6章策点的选择决定随后的子博弈的结构,因此,重复博弈与合作行为从后一个决策点开始的子博弈不同于从前一个决策点开始的子博弈,或者说,同样结构的子博弈只出现一次;张维迎教授•重复博弈(repeatedgame):同样结构的博弈重北京大学光华管理学院复多次,其中的每次博弈被称为“阶段博弈”(stagegame).重复博弈的三个特征重复博弈和合作问题•阶段博弈之间没有物质上的联系,也就•如果博弈不是一次的,而是重复进行的,参与是说,前一阶段的博弈不改变后一阶段人过去行动
2、的历史是可以观察到的,参与人就的结构;可以将自己的选择依赖于其他人之前的行动,因而有了更多的战略可以选择,均衡结果可能•所有参与人观察到博弈过去的历史;与一次博弈大不相同。•参与人的总支付(报酬)是所有阶段博•重复博弈理论的最大贡献是对人们之间的合作弈支付的贴现值之和;行为提供了理性解释;在囚徒困境中,一次博弈的唯一均衡是不合作(即坦白)。但如果博弈无限重复,合作就可能出现。囚徒困境博弈重复博弈与战略空间的扩展B•假定上属博弈重复多次或无限次;那么,每个参与人有多个可以选择的战略:仅举几例:合作不合作•All-D:不论过去什么发生,总是选择
3、不合作;合作•All-C:不论过去什么发生,总是选择合作;3,3-1,4•合作-不合作交替进行;A•tit-for-tat:从合作开始,之后每次选择对方前一阶段的不合作行动;4,-10,0•triggerstrategies:从合作开始,一直到有一方不合作,然后永远选择不合作。1“囚徒困境”的一般表示支付函数•双方都不合作:合作不合作231V(all-d,all-d)PPPP...P1合作T,TS,R•对的解释:不合作R,SP,P–贴现率;–博弈继续的概率;–二者的结合;满足:R>T>P>S;(S+R)4、化:未来收益的重要程度无名氏定理(FolkTheorem)Tit-for-tat•在无限次重复博弈中,如果参与人对未•纳什均衡,但不是精炼纳什均衡:来足够重视(足够大),那么,任何231程度的合作都可以通过一个特定的子博V(TFT,TFT)TTTT...T1弈精炼纳什均衡得到。•这里“合作程度”定义为整个博弈中合V(All-D,TFT)RP2P3P...RP作出现的频率。1•50年代就人所共知,但无人有发明权;WhyNotAPerfectNEAxelrod(1984)•假定A在t=5的时候,5、没有合作。根据TFT战略,•Tit-for-tat是成功率最高的战略在t=6,B应该选择惩罚(不合作)。B会这样吗?•如果B相信A采取的是TFT战略,那么:如果B对A实施惩罚,预期的收入流为:R,S,R,S,R,...•反之,如果B原谅A,T,T,T,T,T,...2Triggerstrategies合作的条件•如果未来足够重要,精炼纳什均衡:•如果下列条件满足,合作就是均衡结果:231V(合作,trigger)TTTT...T11TRP1123V(不合作,trigger)RPPP...6、RP1RTRP解释行为的信息传递•R-T可以理解为不合作的诱惑;•假如欺骗两次才被发现:•R-P是合作的剩余(利益);V(不合作,trigger)•条件说明:2234–给定未来的重要程度,不合作的一次性诱惑RRPPP...R(1)P1(R-T)相对于合作带来的利益(R-P)越小,合作的可能性越大;RTRT–给定不合作的诱惑和合作带来的利益,未来越重要,合作的可能性越大;RPRP含义惩罚与合作•欺骗行为越难以被发现,欺骗发生的可•Abreu(1986):最大合作战略是使用最严厉的7、可能性越大;或者说,合作越困难;信惩罚(thestrongestcrediblepunishment);•维护合作并不需要无限期的惩罚;只要惩罚期•在前面的例子,RR4=4T,T3=3P,P0=0.如果欺骗43足够长就可以了;一次就被发现,只要0.25合作就40•萝卜加大棒(stickandcarrot):从合作开始,一直合作会出现;而如果欺骗两次才被发现,只直到:如果有任何一方在t期不合作,在t+1期,前期合有当0.5时,合作才可能出现;作者选择“不合作”来实施惩罚,前期不合作者选择合作;如果该合作的没有合作或者该惩罚的没有8、惩罚,•一般地,欺骗行为越不容易被发现,合在t+2期继续按照上述t+1期的战略规定博弈;否则,合作越困难。作恢复。3解释不可信的惩罚:垄断厂家•在合作子博弈,合作的条件是:(0,
4、化:未来收益的重要程度无名氏定理(FolkTheorem)Tit-for-tat•在无限次重复博弈中,如果参与人对未•纳什均衡,但不是精炼纳什均衡:来足够重视(足够大),那么,任何231程度的合作都可以通过一个特定的子博V(TFT,TFT)TTTT...T1弈精炼纳什均衡得到。•这里“合作程度”定义为整个博弈中合V(All-D,TFT)RP2P3P...RP作出现的频率。1•50年代就人所共知,但无人有发明权;WhyNotAPerfectNEAxelrod(1984)•假定A在t=5的时候,
5、没有合作。根据TFT战略,•Tit-for-tat是成功率最高的战略在t=6,B应该选择惩罚(不合作)。B会这样吗?•如果B相信A采取的是TFT战略,那么:如果B对A实施惩罚,预期的收入流为:R,S,R,S,R,...•反之,如果B原谅A,T,T,T,T,T,...2Triggerstrategies合作的条件•如果未来足够重要,精炼纳什均衡:•如果下列条件满足,合作就是均衡结果:231V(合作,trigger)TTTT...T11TRP1123V(不合作,trigger)RPPP...
6、RP1RTRP解释行为的信息传递•R-T可以理解为不合作的诱惑;•假如欺骗两次才被发现:•R-P是合作的剩余(利益);V(不合作,trigger)•条件说明:2234–给定未来的重要程度,不合作的一次性诱惑RRPPP...R(1)P1(R-T)相对于合作带来的利益(R-P)越小,合作的可能性越大;RTRT–给定不合作的诱惑和合作带来的利益,未来越重要,合作的可能性越大;RPRP含义惩罚与合作•欺骗行为越难以被发现,欺骗发生的可•Abreu(1986):最大合作战略是使用最严厉的
7、可能性越大;或者说,合作越困难;信惩罚(thestrongestcrediblepunishment);•维护合作并不需要无限期的惩罚;只要惩罚期•在前面的例子,RR4=4T,T3=3P,P0=0.如果欺骗43足够长就可以了;一次就被发现,只要0.25合作就40•萝卜加大棒(stickandcarrot):从合作开始,一直合作会出现;而如果欺骗两次才被发现,只直到:如果有任何一方在t期不合作,在t+1期,前期合有当0.5时,合作才可能出现;作者选择“不合作”来实施惩罚,前期不合作者选择合作;如果该合作的没有合作或者该惩罚的没有
8、惩罚,•一般地,欺骗行为越不容易被发现,合在t+2期继续按照上述t+1期的战略规定博弈;否则,合作越困难。作恢复。3解释不可信的惩罚:垄断厂家•在合作子博弈,合作的条件是:(0,
此文档下载收益归作者所有