《重复博弈博弈论》PPT课件

《重复博弈博弈论》PPT课件

ID:39049501

大小:507.00 KB

页数:75页

时间:2019-06-24

《重复博弈博弈论》PPT课件_第1页
《重复博弈博弈论》PPT课件_第2页
《重复博弈博弈论》PPT课件_第3页
《重复博弈博弈论》PPT课件_第4页
《重复博弈博弈论》PPT课件_第5页
资源描述:

《《重复博弈博弈论》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、重复博弈重复博弈动态博弈的类型序贯博弈sequentialgame每一个阶段的博弈结构是不同的,即从后一个决策结开始的子博弈不同于从前一个决策结开始的子博弈。或者说,同样结构的博弈只出现一次。重复博弈repeatedgame是指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。如“囚徒困境”中小偷每次作案后判刑释放后又作案。分为有限次重复博弈与无限次重复博弈重复博弈人们之间的长期关系与短期关系之间有重要的性质差别,人们在对待与其有长期关系的人与对待那些以后不再交往的人可能会有非常不同的行为。短期难以形成某种默契或合作关系,而长期可以通过报复、制裁的威胁来相互约束各方的行动。有限次重复博

2、弈定义给定一个博弈G,重复进行T次G,并且在每次重复之前各参与人都能观察到以前博弈的结果,这样的博弈过程称为G的一个“T次重复博弈”,记为G(T)。而G则称为G(T)的原博弈。G(T)中的每次重复称为G(T)的一个阶段。几点说明子博弈动态博弈中的子博弈及SPNE在重复博弈中适用策略路径重复博弈使博弈结果有了更多的可能,如果原博弈有n条路径,重复两次博弈则有n2条路径,重复T次就有nT条路径支付特别说明:重复博弈中的支付在有限次博弈中,每一次的博弈都有一组结果即支付组合,因此重复博弈中各参与人的支付应该是他们每阶段支付相加的“总支付”(无限次重复支付的计算要更复杂一些)用每阶段的平均支付来进行

3、比较各阶段重复博弈和各种均衡效率如果博弈次数少,重复时间较近,无需引用贴现系数如果博弈次数较多,重复时间较长,可以引进贴现系数,未来支付折算成当前支付有限重复博弈有限重复博弈简单地说就是阶段博弈实施有限次(T次)。如我们考虑T=2。考虑下列博弈:LRU1,15,0D0,54,412有限重复博弈它有一个Nash均衡(U,L),假设博弈进行两次,两阶段重复博弈中每个参与人的得益相当于各个阶段得益之和(或者平均数),考虑到贴现因子δ,再一次借助于逆向归纳法,第二阶段唯一的Nash均衡为(U,L),得益向量为(1,1),所得的贴现值为(δ,δ),有限重复博弈由此在第一阶段相当于博弈:LRU1+δ,

4、1+δ5+δ,δDδ,5+δ4+δ,4+δ12该博弈有唯一的Nash均衡(U,L),因此我们得到唯一的子博弈完美Nash均衡:{(U,L),(U,L)}有限次重复猜硬币博弈猜硬币博弈是一个零和博弈,重复零和博弈不会创造出任何新的利益(因为每个阶段博弈总是一方赢一方输,总支付还是为零和)。因此双方合作的可能性根本不存在,即使双方都知道还要进行重复许多次这样的博弈也不会改变他们在当前的阶段博弈中的行为方式,即他们不可能变得合作和顾及对方的利益。有限次重复猜硬币博弈所以,以猜硬币博弈作为原博弈的重复博弈中,每个博弈方唯一正确的选择是在每次重复时都采用一次性博弈中所采用的NE,即以0.5的概率随机选

5、择正面和反面的混合策略,双方每次重复的期望值和期望总支付为零。注意的是,所有以零和博弈为原博弈的重复博弈,与上述问题都有相同的结论,即都采用一次性博弈中的纳什均衡策略。有限次重复囚徒困境的博弈如果Policeman给这两个囚徒两次机会,即重复两次原博弈,其结果(即他俩关押的年限)会是怎样?两博弈先进行第一次博弈后,双方都看到最后结果,然后再进行第二次博弈。用逆推归纳法求解先求第二阶段博弈的解——仍是原博弈的解(坦白,坦白)支付组合为(-5,-5)再回到第一阶段。由于双方都知道后一阶段的结果即(-5,-5),因此此时双方都知道整个两次重复博弈的结果,双方的最终支付肯定就是在本阶段的双方支付基础

6、上各加上-5,博弈结果仍是(坦白,坦白)支付组合(-10,-10)有限次重复囚徒困境的博弈第一阶段-1,-1-8,00,-8-5,-5不坦白坦白不坦白坦白囚犯2囚犯1-6,-6-13,-5-5,-13-10,-10第二阶段两次重复囚徒困境的等价博弈有限次重复囚徒困境的博弈从结果上看,两次重复囚徒的困境相当于独立地进行两次一次性的囚徒的困境博弈,然后把两个独立博弈的支付相加。这个结果具有一般意义。在有限次重复博弈中,如果原博弈存在唯一的纯策略NE,则有限次重复博弈的唯一的均衡解就是各博弈方在每阶段中都采用原博弈的NE。因为每个阶段NE都是SPNE,即不存在不可信的威胁和许诺,因此重复博弈的解也

7、是SPNE。定理设原博弈G有唯一的纯策略NE,则对任意正整数T,重复博弈G(T)有唯一的SPNE,即各博弈方每个阶段采用原博弈G的纳什均衡策略。各博弈方在G(T)中的总支付为在原博弈G中支付的T倍,平均每阶段支付等于原博弈G中的支付。注意1可以用逆推归纳法证明该定理。注意2该定理说明了,所有具有唯一NE的静态博弈构成的重复博弈,它们和零和博弈一样,都是原博弈的一次性博弈的简单重复和支付相加。有限次重复削价竞争

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。