完全信息静态博弈纳什均衡解

完全信息静态博弈纳什均衡解

ID:27635795

大小:136.42 KB

页数:9页

时间:2018-12-05

完全信息静态博弈纳什均衡解_第1页
完全信息静态博弈纳什均衡解_第2页
完全信息静态博弈纳什均衡解_第3页
完全信息静态博弈纳什均衡解_第4页
完全信息静态博弈纳什均衡解_第5页
资源描述:

《完全信息静态博弈纳什均衡解》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第四章完全信息动态博弈及其均衡解1.完全且完美信息动态博弈完全信息博弈指的是参与者的收益是共同知识。完全且完美信息动态博弈指的是:博弈中的每一步中参与人都知道这一步之前博弈进行的整个过程。因此,我完全且完美信息动态博弈的特点:(1)行动是顺序发生的;(2)下一步行动选择之前所有以前的行动都可以被观察到;(3)每一可能的行动组合下的参与人的收益都是公共知识。而不完美信息博弈指的是,在某一步参与人不知道以往博弈所进行的历史或者没有观察到以往的所有行动。例4.1.我们来考虑这样一个动态博弈:假定甲在开采一个价值4万元的金矿时需要1万元资金,乙有1万元资金。甲向乙借

2、钱来开金矿。在这个博弈的第一阶段,甲向乙承诺:如果乙借钱给他的话,那么他就会将采到的金子与乙对半分成,即(2,3)——乙得到2万元的金子,同时收回自己的1万元投资。对于甲的承诺,乙如果不借钱给甲的话,那么博弈到此为止,双方收益为(0,1)。如果乙借钱给甲的话,那么博弈进入第二个阶段。在第二阶段中,若甲遵守他的承诺,分给乙一半的金子,这样两人的收益为(2,3),其中1万元为投资成本。〖JP3〗然而,若甲违背自己的承诺,博弈就会进入到第三个阶段:如果乙同甲打官司,那么由于打官司费时费力,两个人的收益为(0,1);若乙不打官司,那么两个人的收益就为(5,0)。参见

3、图1。乙甲借不借甲乙分不分(0,1)乙乙(2,3)打官司不打官司(1,2)(5,0)图1.借钱博弈的博弈树2.逆向归纳法与子博弈纳什均衡解逆向归纳法(Backwardinduction)又称逆推法,是指这样一种动态博弈求解方法:从博弈的最后一步开始,计算最后一步的参与人的最优行动,逐步逆推到博弈开始时进行第一步的参与人的最优行动,从而确定每个参与人的最优行动。在动态博弈中逆向归纳法能够进行的前提:参与人是理性的——任何一步参与人都选择最优策略;理性是公共知识——参与人选择最优策略是其他人所能够预测的。资料在完全且完美信息动态博弈中逆向归纳法能够求得子博弈精

4、炼纳什解。乙甲借╳不借甲乙分╳不分(0,1)乙乙(2,3)打官司╳不打官司(1,2)(5,0)图2.借钱博弈的逆向归纳法的求解过程在例4.1中这样一个动态博弈,用逆向归纳法,我们就可以推知,如果甲做出“不分”的选择,那么乙一定会选择“打”官司。因为对于乙而言,打官司的收益为1,不打官司的收益是0,所以,作为一个理性人,乙一定会选择打官司。而如果甲知道在“不分”的情况下乙必定选择“打官司”,那么甲就一定会选择“分”一半的金子给乙,因为对甲而言,“分”的收益是2,“不分”的收益是0。所以,甲的承诺是可置信的。而对于乙来说,他会选择“借”,因为“借”的收益是3,“

5、不借”的收益是1。因此,该博弈最终的子博弈精炼纳什均衡点就是(2,3)。例4.2.斯坦克尔伯模型。两个厂商垄断某个市场,其中厂商1处于支配地位,它先行动,然后从属企业2后行动。假定市场需求函数为p=a-Q。厂商的单位产品的成本c。这些是企业1和2的公共知识。问:厂商1和2是如何决定的它们的生产产量的。假定厂商1和2所决定的产量分别为q1,q2。我们用逆向归纳法来求解。企业2后行动,对于企业1的任何行动,即任意给定的产量,企业2确定产量以使利润最大,即使L2=p×q2-c×q2最大。假定企业1决定的产量为q1,因为:L2=p×q2-c×q2=(a-q1-q2

6、)×q2-c×q2由dL2/dq2=0:q1-2q2=a-c(1)即:q2=(q1-a+c)/2资料企业1先行动,它能够预知企业2的最优化行为,即在它的最优产量q1给定的情况下,企业将按照q2=(q1-a+c)/2进行决策。这样,企业的利润函数为:L1=p×q1-c×q1=(a-q1-q2)×q1-c×q1=(a-q1-q2)×q1-c×q1而q2是q1如下的函数:q2=(q1-a+c)/2由dL1/dq1=0:q1*=(a-c)/2于是,q2*=(a-c)/4因此,((a-c)/2,(a-c)/4)为逆向归纳法解。该解被称为子博弈精炼纳什均衡解。此时总产量

7、为q2=3(a-c)/4,价格为(a+3c)/4企业1的利润L1=(a-c)2/8企业2的利润为L2=(a-c)2/16请读者与古诺均衡解进行比较。3.动态博弈中的威胁与承诺为了实现最大利益,使博弈在博弈参与人所希望的策略组合上实现,在他人作出行动之前的每一步参与人都会向对方可能做出某种威胁或承诺,希望对方做出或者不做出某个行动。而通过逆向归纳法我们能够区别动态博弈中威胁或承诺是否可信。例4.1:甲向乙承诺:借钱给我,我赚钱后将分给你。甲的承诺是可信的。乙威胁甲:若你不分给我,我将起诉你。乙的威胁也是可信的。之所以发生威胁与承诺的言语现象,是因为轮到他人行动

8、的时候,参与人只能通过言语而影响他人的行动从而实现自

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。