欢迎来到天天文库
浏览记录
ID:39731110
大小:512.61 KB
页数:70页
时间:2019-07-10
《《重复博弈》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第四章重复博弈1.基本概念重复博弈:给定一个基本博弈G(可以是静态博弈,也可以是动态博弈),重复进行T次G,并且在每次重复G之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为G(T)。而G则称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。2.为何研究重复博弈(1)两家企业在一个市场上的传长期竞争;两个企业遵守一份为期10年协议方面的契约;商业中的回头客等等。(2)由于长期合作,通过报复、制裁、威胁等手段的相互约束行为,追求共同的目标,考虑当前利益兼顾将来的利益。(3)长期关系可以理解为博弈阶段较多,时间
2、跨度较大的一般动态博弈。诚信、信任……3.序贯博弈与重复博弈序贯博弈(sequentialgame):参与人在前一个决策点的选择决定后续子博弈的结构,因此,从后一个决策点开始的子博弈不同于从前一个决策点开始的子博弈,或者说,同样结构的子博弈只出现一次;重复博弈(repeatedgame):同样结构的博弈重复多次,其中的每次博弈被称为“阶段博弈”(stagegame)。4.重复博弈的三个特征阶段博弈之间没有物质上的联系,也就是说,前一阶段的博弈不改变后一阶段的结构;所有参与人能观察到博弈过去的历史;参与人的总支付(报酬)是所有阶段博弈支付的贴现值之和;(1)重复
3、博弈的策略重复博弈中每个博弈方在每个阶段都必须进行策略选择,因此博弈方的一个策略就是在每次重复时,针对其前面阶段所有可能的情况如何进行行动的计划。(2)重复博弈的子博弈重复博弈的子博弈就是从某个阶段(除第一阶段以外)开始,包括此后所有阶段的重复博弈部分。重复博弈的子博弈要么仍然是重复博弈,只是重复的次数较少,要么就是原博弈。5.重复博弈的策略、子博弈和均衡路径(3)重复博弈的均衡路径重复博弈的路径是由每个阶段博弈方的行动组合串联而成的。而且对应前一阶段的每一种结果,下一阶段都有原博弈全部策略组合数那么多种可能的结果,如原博弈有m种策略组合,那么重复两次就有m2
4、条博弈路径,重复T次就有mT条博弈路径,因此在重博弈中,博弈方在重复博弈中的策略空间要远远大于在每个阶段博弈中的策略空间,重复博弈的路径数往往是很大的,常常可以产生一些意想不到的均衡路径。6.重复博弈的支付方法之一是计算重复博弈的”总支付”,即博弈方各次重复支付的总和;另一种方法是计算各阶段的“平均支付”,即总支付除以重复次数。7.重复博弈和信誉问题如果博弈不是一次性的,而是重复进行的,参与人过去行动的历史是可以观察到的,参与人就可以将自己的选择依赖于其他人之前的行动,因而有了更多的战略可以选择,均衡结果可能与一次博弈大不相同。重复博弈理论的最大贡献是对人们之
5、间的合作行为提供了理性解释;在囚徒困境中,一次博弈的唯一均衡是不合作(即坦白)。但如果博弈无限重复,合作就可能出现。8.关于重复博弈的一般化讨论重复博弈可用于研究人们长期之间相互作用关系重复博弈的基本思想是,一个参与者将会考虑自己当前的行为对其他参与者未来行为的影响,旨在阐释人们的合作、报复和威胁等现象。基本思想重复博弈的基本思想可以用两个人重复进行“囚徒困境”博弈来阐述.在一次性博弈中,囚徒困境具有唯一的纳什均衡,即每个局中人都选择不合作(即坦白,记作D),(D,D)是唯一的结果尽管如此,每个参与者如果选择合作C,则状况将得到改善。基本思想只要博弈是重复进行
6、的,那么合作对双方来说就是有吸引力的。每个人都相信背叛行为将会使合作终止,所导致的长期损失超过了短期收益。可用于解释社会行为规范。9.有限重复博弈和无限重复博弈根据博弈重复次数划分两种情形的结果是截然不同的10.囚徒困境博弈合作不合作合作不合作-1,-1-10,00,-10-8,-8局中人1局中人2重复博弈与战略空间的扩展假定上属博弈重复多次或无限次;那么,每个参与人有多个可以选择的战略:仅举几例:All-D:不论过去什么发生,总是选择不合作;All-C:不论过去什么发生,总是选择合作;合作-不合作交替进行;tit-for-tat:从合作开始,之后每次选择对方
7、前一阶段的行动;trigger(grim)strategy:从合作开始,一直到有一方不合作,然后永远选择不合作。“囚徒困境”的一般表示合作不合作合作不合作T,TS,RR,SP,P满足:R>T>P>S;(S+R)8、可ALLC、ALLD(ALLC,ALL
8、可ALLC、ALLD(ALLC,ALL
此文档下载收益归作者所有