欢迎来到天天文库
浏览记录
ID:60747156
大小:470.00 KB
页数:65页
时间:2020-12-13
《第12章-精炼贝叶斯Nash均衡ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第四部分:不完全信息动态博弈第十二章精炼贝叶斯Nash均衡主要内容:一、均衡的精炼与信念二、信念设定三、精炼贝叶斯Nash均衡四、几种均衡概念的比较主要内容:一、均衡的精炼与信念二、信念设定三、精炼贝叶斯Nash均衡四、几种均衡概念的比较第十二章精炼贝叶斯Nash均衡在完全信息动态博弈中,假设s*为一子博弈精炼Nash均衡,那么在参与人采用均衡战略s*的情况下,不管博弈的进程如何或是否发生,每个参与人的战略对从任一决策结开始的子博弈(或在其后轮着他采取的行动)都是最优的。子博弈精炼Nash均衡中
2、的这种“均衡精炼”的思想,也可应用到不完全信息扩展式博弈中。作为上述“均衡精炼”思想的自然应用,必然要求每个参与人的均衡战略在其每个信息集上都为最优。例如不仅要求参与人2的均衡战略在由单决策结构成的信息集上最优,而且还要求参与人3的均衡战略在由多决策结构成的信息集和上最优。但对于位于由多决策结构成的信息集(I3({x4,x5})或I3({x6,x7}))上的参与人3,当轮到他行动时,由于对已发生的历史即参与人2是选择了L’还是R’并不清楚,因此也就不知道自己是位于决策结x4(或x6)还是决策结x
3、5(或x7)上。在这种情况下,参与人3对信息集(I3({x4,x5})或I3({x6,x7}))后的博弈进程就不清楚,因而对自己的选择所导致的博弈结果也就不清楚,从而使得参与人3无法确定自己的最优行动。虽然位于多决策结信息集上的参与人,对自己到底位于信息集中哪一个决策结上不能给出一个明确的判断,但一般情况下还是能够对自己位于哪一个决策结,给出一个“大概的估计”。当位于多决策结信息集上的参与人能够用一个定义在该信息集上的概率分布,来对自己位于哪一个决策结进行描述时,就称参与人在该信息集上具有了关于
4、自己位于哪一个决策结的信念(或推断)。而当参与人具有了关于自己位于哪一个决策结的信念(或推断)时,就可借助这种信念(或推断)来指导自己的决策(或选择)。考察如下完全但不完美信息动态博弈:如果参与人1选择R,则博弈结束(参与人2没有行动)。如果参与人1选择了L或M,则参与人2就会知道1没有选择R(但不清楚1是选择了L还是M),并在L’和R’两个行动中进行选择,博弈随之结束。给出了上述博弈的战略式描述在两个子博弈精炼Nash均衡中,均衡(R,R’)明显要依赖于一个不可信的威胁,因此,该博弈只有一个合
5、理的纯战略子博弈精炼Nash均衡——(L,L’)根据Selten所给出的子博弈精炼Nash均衡的定义,是无法将不合理的子博弈精炼Nash均衡(R,R’)排除掉的。如果能将子博弈精炼Nash均衡的思想推广到多决策结信息集,并在每个信息集上给出一个参与人关于自己位于该信息集中哪一个决策结的信念(或推断),则可以将某些不合理均衡剔除掉。给定参与人2的一个推断,[p]表示参与人2位于左边决策结的概率为p,[1-p]表示参与人2位于右边决策结的概率为1-p。参与人2选择L’的期望收益为:而参与人2选择R’
6、的期望收益为:由于对任意的p,都有2-p>1-p,这就排除了参与人2选择R’的可能性。因此,在上述博弈中,简单要求参与人2持有一个推断,并且在此推断下选择最优行动,就足以使我们排除不合理的均衡(R,R’)。考察更一般情形的博弈:在该博弈中,战略组合(R,R’)也是参与人2的信息集未能达到的一个子博弈精炼Nash均衡。如果参与人2的信息集一旦能够达到,参与人2的最优选择就依赖于他关于已发生历史的信念,即一旦博弈进入参与人2的信息集,参与人2关于自己位于哪一个决策结的推断。参与人2选择L’与R’的期
7、望收益分别为2-p和1+p,因此,如果p>1/2,则最优战略为R’;如果p<1/2,则最优战略为L’。要将子博弈精炼Nash均衡中“均衡精炼”的思想应用到不完全信息扩展式博弈中,就必须做到:对每个参与人i,在其信息集上给出关于自己位于该信息集中哪一个决策结的信念(或推断);对参与人i的每个信息集,在给定参与人i在该信息集上的信念(或推断)情况下,参与人的战略是对其他参与人战略的一个最优反应,即参与人的选择必须满足序惯理性(sequentialrationality)。主要内容:一、均衡的精炼与信
8、念二、信念设定三、精炼贝叶斯Nash均衡四、几种均衡概念的比较第十二章精炼贝叶斯Nash均衡精炼贝叶斯Nash均衡既包含了一个战略组合,又包含一个信念系统。这里信念系统对每个信息集都确定了位于该信息集上的参与人所持有的信念。这种信念是信念持有人对已发生历史的一个推断,也可理解为他对自己位于信息集上哪一个决策结的“一种估计”。通过给定参与人在信息集上的信念,来对不完全信息扩展式博弈的均衡进行精炼,是Selten子博弈精炼Nash均衡中“均衡精炼”的思想在不完全信息扩展式博弈中的自然应用。给定参与人
此文档下载收益归作者所有