资源描述:
《博弈论的基本概念》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、博弈论的基本概念•博弈论是研究两人或多人谋略和决策的理论。•博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博
2、弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。•参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。参与者可以是自然人,也可以是团体。•信息:信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者
3、各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。•策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。通常用si表示参与者i的一个特定策略,用Si表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。如果n个参与者没人选择一个策略,那么s=(s1,s2,…,sn)称为一个策略组合。•收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用ui表示参与者i的收益,它是策略组合的函数。•均衡:均衡是所有参与者的最优策略组合,记为s*。几个经典的博弈实例•例一囚徒困境两个共同
4、作案的犯罪嫌疑人被捕,并受到指控。除非至少一人认罪,否则警方无充分证据将他们按最论刑。警方把他们隔离审讯,并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱一个月;如果双方都坦白,根据案情两人将被判入狱六个月;如果一个招认而另一个拒不坦白,招认者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月。囚徒一沉默坦白沉默坦白-1,-1-9,00,-9-6,-6•例二海滩占位甲、乙两个冷饮摊贩,他们在一个直线状的海滩上,以同样的价格,相同的质量向均匀散布在海滩上的众多游客销售冷饮。既然是做生
5、意,目的总是多赚钱,甲乙两人有时在同一地点做同样的生意,竞争是难免的,这两个摊贩应该怎样安排自己的摊位,才能相安无事的做自己的生意?(假定游客总是到据自己最近的摊位购买冷饮)。•例三智猪争食猪圈里有一头打猪和一头小猪。里面有一个猪食槽,槽的对面装有控制开关。只要去拱开关,就会有一次6个单位的饲料流进槽里。如果它们都不去拱开关,那么它们都吃不到饲料;如果小猪去拱,那么等到它跑回来时,大猪已把饲料吃光了;如果大猪去拱,等它回来时可以吃到1个单位的饲料;如果他们一起去拱,在一起跑回来,那么大猪可以抢到4个单位的饲料,小猪也能吃到2个单位的饲料。假定每拱
6、一次开关需要消耗0.5个单位的饲料能量。它们长期一起进食,上面所说的情况两只猪都知道。它们应该如何选择?拱不拱拱0,06,-0.50.5,53.5,1.5大猪小猪不拱完全信息静态博弈•静态博弈:静态博弈指的是博弈的参与者同时选择各自的行动,即便是选择行动有先后的话,后行动者也不知道先行动者所采取的行动。•博弈的标准表述(策略表述)含有三个要素(1)博弈参与者集合iÎN;(2)每个参与者的策略空间Si;(3)每个参与者的收益函数ui。•定义:在一个有n个参与者的博弈中,参与者的策略空间S1,S2,…,Sn,收益函数为u1,u2,…,un,称G={S
7、1,S2,…,Sn;u1,u2,…,un}为此博弈的一个标准表述。•定义:如果对任一si’ÎSi,si’¹si*,不等式ui(s1,…,si-1,si*,si+1,…,sn)>ui(s1,…,si-1,si’,si+1,…,sn)对所有的策略组合(s1,…,si-1,si+1,…,sn)都成立,那么si*称为参与者i的严格占优策略。•定义:在博弈的标准表述中,如果对所有的参与者iÎN,si*是i的严格占优策略,那么策略组合s*=(s1*,…,sn*)称为严格占优策略均衡。•定义:在标准表述的博弈中,设si’和si’’是参与者i的两个可选策略,若u
8、i(s1,…,si-1,si’,si+1,…,sn)