欢迎来到天天文库
浏览记录
ID:8995273
大小:6.65 MB
页数:51页
时间:2018-04-14
《博弈论耶鲁大学公开课转》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、博弈论_耶鲁公开课__笔记及扩展1.博弈(gametheory)构成要素:参与人players:i,j策略集strategyset:Si策略sis-i最优战略si*效益(目标)payoff:UiUi(s1,。。。si。。。sn)博弈game:G={S1,S2....Sn;U1,U2....Un}2.博弈论简史理论提出:1944冯诺依曼(计算机之父、博弈论之父)与摩根斯坦恩合作出版《博弈论与经济行为》提出了博弈概念;提出了零和博弈(Zero-sumgame);引进了合作博弈理论发展:a.奠定非合作博弈基石:1950Tucker提出了“囚徒
2、困境”;1950-1951纳什:引入纳什均衡,将博弈论从零和博弈推进到非零和博弈;定义非合作博弈并证明纳什均衡存在;1994年诺贝尔经济学奖(与seltenharsanyi共同拿到)b.1965-1975泽尔腾Selten将纳什均衡推广到动态博弈并提出子博弈精炼均衡;发展了倒退归纳分析方法;提出颤抖手均衡c.1967-1968海萨尼harsanyi将纳什均衡推广到非完全信息博弈并突出贝叶斯均衡3.博弈的分类是否合作合作博弈cooperativeganme非合作博弈non-operativeganme一般说博弈指后者后者又分一下四类根据:
3、是否完全信息是否同时进行完全信息静态博弈(囚徒困境prison'sdilemma)纳什均衡Nashequilibrium完全信息动态信息(抢劫博弈)子博弈精炼均衡subgameperfectNashequilibrium非完全信息静态博弈(密封报价拍卖模型)贝叶斯纳什均衡BayesianNashequilibrium非完全信息动态博弈(就业市场信号黔驴技穷)精炼贝叶斯纳什均衡perfectBayesianNashequilibrium完全信息completeinformation与完美信息perfectinformation完全信息指每
4、个参与者都知道其他人的可行策略以及收益(支付函数),如果一个博弈不是完全信息,那么参与者就不可能知道自己的行为对其他博弈者的影响完美信息指参与者对其他参与者行动action的完全知识的状态,并随信息的出现而更新。比如下象棋中你不可能知道对手下一手棋是为了吃马还是吃兵或者其他的什么,但是你确确实实知道对手下了一手棋4.严格劣策略strictlydominatedstrategy弱劣策略weaklydominatedstrategy重复剔除严格劣策略iterativedeletion-》*共同知识commonknowledge的重要性霍特林
5、Hotelling模型1929中间选民原理middlevoterstheron漏洞:条件多维度选民非evenlydistributemodel的局限性:与现实状况的差距-》其他因素对model的纠正完全信息静态博弈------------------------------------------------------------------------------------------------------------a.基本分析方法(适用范围由小至大):&1上策(占优策略Dominantstrategy)均衡:在某个博弈中,不
6、管其他博弈者如何选择,一博弈方的策略带来的效益永远优于选择其他策略的效益,至少不低于(如囚徒困境中选择坦白)&2重复剔除严格劣策略&3划线法寻找自己的最优策略集寻找其他博弈者最优策略集寻找交集&4箭头法箭头指示提高自己效益的方向综合分析箭头的走向决定最优策略b.纳什均衡NashEquilibrium(NE):给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你最好的策略。即双方在对方给定的策略下不愿意调整自己的策略。*纳什定理:在一个有n个博弈方的博弈G={S1,S2,'''Sn;U1,U2...Un}中,如果n是有限的,且
7、Si(i=1,2.。。。n)都是有限集,则该博弈至少存在一个纳什均衡,但可能包含混合策略*纳什均衡的意义在于其一致预测性即所有人都预测到某一博弈结果会出项,那么所有人都不会背离这个结果*纳什均衡的存在性与多重性:任何有限博弈都存在至少一个(可能有多个)纳什均衡(有限博弈:博弈有有限个参与者且每一个参与者都存在有限个纯战略)*纳什均衡双定理:@定理一:如果用重复剔除严格劣策略剔除了除(s1*,s2*。。。sn*)以外的策略组合那么剩余的这个策略组合就是唯一的纳什均衡@定理二:如果策略组合(s1*,s2*。。。sn*)是博弈G的纳什均衡,那
8、么该策略组合不会被重复剔除严格劣策略所剔除MaxUi(si,s-i)si∈Si最佳策略bestresponse囚徒困境:个人理性与集体理性的矛盾;应用如下:古诺Cournot双头垄断模型(产量1838)公共
此文档下载收益归作者所有