资源描述:
《哈工大管理学院 选修课 博弈论 第4讲ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、NashEquilibriumTheactionprofiles*isaNashEquilibriumif,foreveryplayeriandeveryactionsiofplayeri,s*isatleastasgoodasaccordingtoplayeri’spreferencesasthetheactionprofile(si*,s-i*)inwhichplayerichoosessi*whileeveryotherplayerchooses-i*.Equivalently,foreveryplayeri,ui(s*)≥
2、ui(si,s-i*),Foreveryactionofplayeri1DefinitionInthen-playernormal-formgameG={S1,…,Sn;u1,…,un},thestrategies(s1*…,sn*)areaNashequilibriumif,foreachplayeri,si*is(atleasttiedfor(至少不劣于))playeri’sbestresponsetothestrategiesspecifiedforthen-1otherplayers,(s1*…,sn-1*,sn+1*,…
3、,sn*):ui(s1*…,sn-1*,si*,sn+1*,…,sn*)≥ui(s1*…,sn-1*,si,sn+1*,…,sn*)……………………………………….(NE)2foreveryfeasiblestrategysiinSi;Thatis,si*solvesmaxui(s1*…,sn-1*,si,sn+1*,…,sn*).si∈Si上述均衡概念是1951年由数学家约翰·纳什(JohnNash)首先解释清楚的,所以将他所解释的均衡称为纳什均衡。3纳什均衡的通俗定义纳什均衡是一种策略组合,给定对手的策略,每个参与人选择自己的
4、最优策略。41Ifgametheoryistoprovideauniquesolutiontoagame-theoreticproblemthenthesolutionmustbeaNashequilibrium,inthefollowingsense.Supposethatgametheorymakesauniquepredictionaboutthestrategyeachplayerwillchoose.Inorderforthispredictiontobecorrect,itisnecessarythateachpla
5、yerbewillingtochoosethestrategypredictedbythetheory.Thuseachplayer’spredictedstrategymustbethatplayer’sbestresponsetothestrategiesoftheotherplayers.Suchapredictioncouldbecalled5strategicallystableorself-enforcing,becausenosingleplayerwantstodeviatefromhisorherPredicte
6、dstrategy.WewillcallsuchapredictionaNashequilibrium.-----------------------------RobertGibbonsP82是这样的一种稳定的策略组合:当所有参与人的选择公开以后,每个人都满意自己作出了正确的选择;没有人能得到更好的结果了。在博弈论中这种结果被称为NE。63为了理解纳什均衡的哲学含义,让我们设想n个参与人在博弈之前协商达成一个协议,规定每一个参与人选择一个特定的策略。我们要问的一个问题是,给定其他参与人都遵守这个协议,在没有外在强制的情况下,
7、是否有任何人有积极性不遵守这个协议?显然,只有当遵守协议带来的效用大于不遵守协议时的效用,一个人才会遵守这个协议。如果没有任何参与人有积极性不遵守这个协议,我们说这个协议是可以自动实施的(self-enforcing),这个协议就构成一个纳什均衡;否则,它就不是一个纳什均衡74纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。纳什均衡是博弈将会如何进行的“一致”(consistent)预测,这意指,如果所有参与人预测特定纳什均衡会出现,那么没有参与人有动力采用与均衡不同的行动。因此纳什均衡(也只有纳什均衡
8、)能具有性质使得参与人能预测到它,预测到他们的对手也会预测到它,如此继续。与之相反,任何固定的非纳什均衡如果出现就意味着至少有一个参与人“犯了错”,或者是对对手行动的预测上犯了错,或者是(给定那种预测)在最大化自己的收益时犯了错。(JeanTiro