欢迎来到天天文库
浏览记录
ID:5589237
大小:1010.50 KB
页数:21页
时间:2017-12-19
《《博弈论:原理、模型与教程》第07章 子博弈精炼nash均衡 第02节 子博弈精炼nash均衡的求解》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、《博弈论:原理、模型与教程》第二部分完全信息动态博弈第7章子博弈精炼Nash均衡7.2子博弈精炼Nash均衡的求解(重点!)(已精细订正!)定义7-1虽然给出了子博弈精炼Nash的定义,但没有说明如何求解子博弈精炼均Nash衡。下面以图6-8中扩展式博弈为例,介绍一种最常用的求解子博弈精炼Nash均衡的方法—逆向归纳法。(讲!)212,116121,11,213,0图6-8博弈树考察图6-8中的博弈。参与人1在博弈开始时(即在信息集上面临两种选择—行动和行动。参与人1此时选择哪种行动呢?对于理性的参与人1来讲,只会选择使自己支付最大化的行动。从图6-8很容易知道参与人1选择行动时
2、所得到的支付为;但是,如果参与人1选择行动,则所得支付就要取决于参与人2在信息集上的选择,以及博弈达到决策结时参与人1在信息集上的选择。也就是说,参与人1选择行动所得支付,取决于子博弈的结果。因此,为了确定参与人1在博弈开始时的选择,就必须确定参与人1选择行动的所得支付,而为了确定参与人1选择行动的所得支付,就必须先求解子博弈。如何求解博弈呢?可以采用同样的方法来求解子博弈,即在求解子博弈的基础上,确定参与人2在信息集上的选择,从而求解子博弈。21由以上分析可以得到图6-8中博弈的求解过程:首先求解博弈树中最底层的子博弈得到子博弈的结果为(即参与人1选择);再求解博弈,容易得到博
3、弈的结果(即参与人2选择);最后求解原博弈,即子博弈,得到博弈的结果为(即参与人1选择)。(讲!)考察更一般的情形。对于图7-6中的博弈树,参与人在信息集选择行动还是行动,取决于选择行动和行动所带来的后果。由于参与人选择行动时使博弈进入了子博弈,因此参与人选择行动的后果就是得到子博弈。同样,参与人选择行动的后果就是得到子博弈。所以,参与人在信息集上的最优选择,取决于参与人在信息集上可能采取的行动,所导致的各个子博弈。也就是说,参与人在信息集上的最优选择,一定是使博弈进入能给自己带来最大支付的子博弈。因此,为了确定参与人在信息集上的选择,就必须先求解参与人在信息集上可能采取的行动所
4、导致的各个子博弈。而对于各个子博弈求解又可以采用同样方法进行。21图7-6一般情形的博弈树由以上分析可以得到求解有限扩展式博弈的一般步骤:找出博弈的所有子博弈由于原博弈为有限扩展式博弈,因此博弈的子博弈有限。。按照博弈进行的“反方向”逐一求解各个子博弈,即最先求解最底层子博弈,再求解上一层的子博弈,……,直至原博弈。也就是说,在求解每一个子博弈时,该子博弈要么不含有其他任何子博弈,要么所含子博弈都已被求解。上述求解有限扩展式的方法亦称“逆向归纳法”(backward21induction)。由于逆向归纳法对各个子博弈逐一进行求解,因此逆向归纳法所得到的解在各个子博弈上构成均衡。这
5、也意味着逆向归纳法所得的解为子博弈精炼Nash均衡。(重点,讲!)【例7-2】考察如图7-7所以的扩展式博弈。图7-7中,博弈存在5个子博弈,即子博弈、、、和(即原博弈),其中、和为最底层的子博弈。下面利用逆向归纳法求解博弈的子博弈精炼Nash均衡。5,1,,,1,12,31图7-7逆向归纳法求解扩展式博弈21求解最底层的子博弈—子博弈、和。子博弈的结果为(即参与人2选择),子博弈的结果为(即参与人1选择),子博弈的结果为(即参与人选择)。求解上一层的子博弈。由于的上一层子博弈含有尚未求解的子博弈,因此此时不能直接求解博弈。和的上一层子博弈为,而所含的子博弈(即和都已求解,所以此
6、时可以求解子博弈。求解,可得博弈的结果。Nash均衡为在子博弈的Nash均衡中,为参与人1的战略,表示参与人1在信息集选择,在信息集选择;为参与人2的战略。(即参与人1选择,参与人2选择)。由于(即原博弈)所含子博弈都已求解,因此可以求解。求解,可得博弈的结果为,Nash均衡为在Nash均衡中,为参与人1的战略,表示参与人1在信息集选择,在信息集)选择;在信息集选择;为参与人2的战略,表示参与人2在信息集选择,在信息集选择。。由于在各个子博弈上都构成Nash均衡,因此即为如图7-7所示扩展式博弈的子博弈精炼Nash均衡。21(讲!)从逆向归纳法求解子博弈精炼Nash均衡的过程可以
7、看到:在求解任一子博弈时,参与人在该子博弈的初始决策结上的选择,对余下的博弈进程而言是最优的。例如,在图7-6中,当求解子博弈时,参与人在信息集上的选择,是使博弈进入能给自己带来最大支付的子博弈。因此,从这个意义上讲,应用逆向归纳法所得到的博弈的解—子博弈精炼Nash均衡,在一定程度满足动态规划的最优原理动态规划的最优性原理是指“作为整个过程的最优战略具有这样的性质:无论过去的状态和决策如何,对前面的状态和决策所形成的状态而言,余下的诸决策必须构成最优策略”。简言之,一个最优战略
此文档下载收益归作者所有