欢迎来到天天文库
浏览记录
ID:39281830
大小:74.00 KB
页数:15页
时间:2019-06-29
《第一章完全信息非合作静态博弈》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第一章完全信息非合作静态博弈例一囚徒困境本例子对奠定非合作博弈理论基础起着重大作用。假定有两个嫌疑犯A和B作案后被抓住,关在不同审讯室审讯,他们部知道,如果两人都坦白各判刑8年,若两人都抵赖各判1年,若一人坦白另一人抵赖坦白者释放抵赖者判十年,下图给出本例的完整数学描述:囚徒B坦白抵赖-8,-80,-10-10,0-1,-1坦白囚徒A抵赖(囚徒A,囚徒B)基本假定:1)两囚徒都是理性的;2)两囚徒都了解对方是理性的;3)两囚徒都了解在各种情况下审判后果的信息;4)两囚徒都了解对方了解在各种情况下审判后果的信息。研究问题:预测最终结果。结论:从上表看出A与B同样是:不管对方采取什么行
2、动,坦白都是最优的,因而两囚徒若满足上述条件他们所采取的行动都是坦白。(坦白,坦白)称为本博弈的均衡解。从上述模型中看出,如果两人都选择抵赖,对两人都是最好的,但结果他们只能选择较差的结果,都坦白,不论他们事先如何订立攻守同盟都无效,原因出在上述四点假设上。囚徒困境表现为个人理性压倒集体理性。例二智猪博弈猪圈有两头理性的智猪,一头大猪,一头小猪。猪圈一头放着食,另一头有一按钮,供智猪食供应。按一下按钮会有10单位猪食进糟,但谁按谁就要付出2单位代价。若大猪先到、大猪吃到9单位,小猪吃到1单位,若同时到大猪吃到7单位,小猪吃到3单位,若小猪先到,大猪吃到6单位,小猪吃到4单位。本问题
3、可用下形式表示:小猪按等待5,14,49,-10,0按大猪等待(大猪,小猪)基本假设:与囚徒困境相同,即理性人假设和完全对称信息假设。问题分析:很显然小猪的最优策略是等待,大猪很清楚小猪最优策略是等待,而且必然采取等待行动,那么大猪的策略是按,于是其结果必然是大猪按小猪等待。(大猪按,小猪等待)为本博弈均衡解。智猪问题本质:在合作共事中谁享受成果多谁多出力。三、基本概念包括:参与人、行动、信息、战略、支付(效用)、结果、均衡。其中参与人、战略、支付是描述一个博弈所需的最少要素;行动和信息是其“积木(建材)”;参与人、行动和结果称为“博弈规则”。博弈分析的目的是使用博弈规则预测均衡。
4、1.参与人博弈中决策主体,他的目的是通过迭择行动(或战略)以最大化自己的支付(效用)水平。除一般意义的参与人外,博弈论把“自然”作为虚拟参与人来处理。2.行动参与人在博弈的某个时点的决策变量。用ai表示第i个参与人的一个行动,Ai={ai}表示第i个参与人可选择的行动集合。在n人博弈中参与人的行动有序集a=(a1,…,an)称为行动组合。与行动相关的一个重要问题是行动的顺序,行动顺序往往决定博弈的结果。实际上静态博弈与动态博弈是由行动顺序来划分的。在博弈论中一般假定参与人的行动空间和行动顺序是析有参与人的共同知识。3.信息参与人有关博弈的知识。(关于信息以后将更详细介绍)。“共同知
5、识”是所有人知道,所有人知道所有知道……的知识。4.战略参与人在给定信息集下的行动规则。战略与行动不同。5.支付特定的战略组合下参与人确定的效用水平,或期望效用水平。6.结果博弈分析者所感兴趣的所有东西,加均衡战略组合、均衡行动组合、均衡支付组合等。7.均衡所有参与人的最优战略组合。四、战略表达式·一个博弈可以用两种不同方式来表示,一种是战略表达式,另一种是扩展式,战略式适于分析静达博弈,扩展式适于表示动态博弈。·战略式又称标准式,在这种表述中,所有参与人同时各自选择各自的战略。·战略式更准确表述为:1.博弈参与人集合:i∈G,=G(1,2,…,n);2.每个参与人战略空间:Si;
6、3.每个参与人的支付函数:ui(s1,…,sn)。用G={s1,…,sn;u1,…,un}代表战略式表述博弈。当参与人为两人时则可表示为矩阵形式。五、纳什均衡纳什均衡描述性陈述定义,如果一个博弈存在一个战略组合,任何参与人要改变这一战略组合都可能导致降低自身的效用水平(或只能保持原有的效用水平),因而任何参与人都没有积极性去改变这一战略组合,这一战略组合称该博弈的纳什均衡。六、求解纳什均衡方法(一般方法)定义:有n个参与人的战略表述博弈G={s1,…,sn;u1,…,un},战略组合s*=(s1*,…,si*,…,sn*)是一个纳什均衡,如果对于每个i,si*是给定其他参与人选择s
7、-i*=(s1*,…,si-1*,si+1*,…,sn*)的情况下第i个参与人的最优战略,即:Ui(si*,s-i*)≥Ui(si,s-i*)"siÎSi,"I(﹡)或表述为:si*=argmaxui(s1*,…,si-1*,si,si+1*,…,sn*)(﹡﹡)(﹡﹡)式为纳什均衡求解的基本公式。从上式得出以下方法:Дi(s1,…,sn)=¶ui(s1,…,sn)/¶si=0Дi(s1,…,sn)称为si对(s1,…,si-1,si+1,…,sn)反应方程,即第i个
此文档下载收益归作者所有