欢迎来到天天文库
浏览记录
ID:5263821
大小:181.25 KB
页数:33页
时间:2017-12-07
《6 重复博弈和策略性行动(1)》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第六章重复博弈和策略性行动(1)主要内容•6-1囚徒困境的有限重复•6-2囚徒困境的无限次重复•6-3重复次数不确定的情形6-1囚徒困境的有限重复•囚徒困境–抵赖是一个合作策略;局中人是合作者。–坦白是一个背叛策略;局中人是背叛者。乙坦白抵赖-3-5坦白-30甲0-1抵赖-5-1•囚徒困境的重复博弈中出现局中人的合作,是因为局中人担心一次不合作会招致未来合作机会的丧失。如果未来合作的价值很大,超过采取背叛策略所能获得的短期收益,则出于对长远利益的考虑,双方会形成非契约的默契,使彼此都从默契的非契约合作中得到好处。例子:囚徒困境的价格大战版本•两个
2、企业垄断了一种商品的市场,如果都实行高价,各得利润5万;如果你高我低,我得6你得1;如果都实行低价,双方利润都是3万。•假定两个企业每个星期一都要重新定价,“价格大战”按照星期的频率重复。•讨论双方在重复博弈中合作的问题。乙低价高价31低价36甲65高价15•一般性的分析:–假定开始的时候两家企业彼此合作,双方都实行高价。–如企业乙在某个星期一偏离这个定价策略,则它在这个星期的利润会从5万上升到6万。–甲觉得不应当继续他们之间的合作,合作瓦解。乙在往后每个星期的利润都只能是3万,而不是没有采取背叛策略之前的5万。–乙在采取背叛策略的当周获得的1万
3、利润的增加,是以往后每个星期损失2万为代价的。即使这种合作关系的潜在持续期只有两周,采取背叛策略也不是企业乙的最优选择。•问题:如果甲乙之间的合作关系恰好持续两个星期的话,结果会是怎样呢?–倒推法:从第二个星期开始分析,最后一次博弈,不必为将来打算,各人都只追求这次博弈的利益。背叛是一个优势策略。–第一阶段即倒数第二个星期的博弈,局中人已经清楚,最后一次博弈对方肯定要实行低价,不管我现在对他如何好心(收缩产量维持高价),也不会在下一次得到好报。因此,双方都只追求当时的私利,都会采取背叛策略。–两阶段的价格大战博弈就无法走出囚徒困境。•在囚徒困境多
4、阶段重复的博弈中,只要两个局中人的策略互动关系所持续的时间固定(重复次数是预先确定的有限数),那么在理性人假设之下,重复博弈的结果一定是每个局中人在每次博弈都采取背叛策略。•定理:令G表示阶段博弈,G(T)是G重复T次的重复博弈,T<∞。如果G有唯一的纳什均衡,那么重复博弈G(T)的唯一的子博弈精炼纳什均衡的结果,是阶段博弈G的纳什均衡重复T次,即在每个阶段博弈出现的都是一次性博弈的那个均衡结果。6-2囚徒困境的无限次重复•根据先前双方是否合作,决定自己下一阶段的策略是选择合作还是选择背叛,这类策略被笼统地称为依存策略或相机策略(continge
5、ntstrategies)。•大多数依存策略都是触发策略(triggerstrategies)。–一个局中人使用触发策略,意味着只要他的对手在博弈中一直采取合作策略,则该局中人也会在博弈中继续采取合作策略;但是,一旦对手在某一个阶段采取背叛策略,将会触发该局中人在往后的一段时期内采取不合作策略,甚至永远采取不合作策略,从而对对手实施惩罚。–两个最著名的触发策略:•冷酷策略(Grimstrategies)•礼尚往来策略(Titfortatstrategies)冷酷策略•双方一开始的时候选择合作,然后继续选择合作,直到一方选择背叛,从此永远选择背叛。
6、–任何局中人的一次性不合作将触发永远的不合作。礼尚往来策略•双方从合作开始,在以后的每个阶段,如果对手在最近的一次博弈中采取合作策略或者在最近连续K次博弈中采取合作的策略,则你继续跟他合作;如果你的对手在上一阶段的博弈中采取背叛策略,则你在下次的博弈中采取背叛策略报复他,或者在下面连续K次博弈中采取背叛策略报复他。–惩罚K次的礼尚往来策略:自然数K,即被背叛以后,究竟连续惩罚或者报复几次。•惩罚1次的礼尚往来策略,也叫做严格的礼尚往来策略。•严格礼尚往来策略:在开始阶段博弈合作,以后则模仿对手在前一阶段博弈的行动,对手上次对我怎样,这次我就对他这
7、么样。•严格的礼尚往来策略=不记仇的礼尚往来策略•冷酷策略=记仇的礼尚往来策略=惩罚无穷次的礼尚往来策略礼尚往来实验•密歇根大学的罗伯特·艾克谢罗德(RobertAxelrod)设计了一个两人“囚徒困境”重复博弈计算机模拟竞赛。•计算机模拟竞赛的思路:–任何参加这个竞赛的人都扮演囚徒困境中一个囚犯的角色,把自己的策略编成计算机程序;–他们的程序会被成对地融入不同的组合,分好组以后,参与者就开始玩“囚徒困境”的游戏。他们每个人都要在合作与背叛之间做出选择;–以循环赛的方式玩上200次;–游戏允许在做出合作或背叛抉择时参考对手程序前几次的选择。如果已
8、经交手过多次,则双方就建立了各自的历史档案,用以记录对手的交往情况,通过多次交手树立了或好或差的声誉。结果•第一轮游戏有14个程序参加,
此文档下载收益归作者所有