资源描述:
《博弈论与经济全套配套课件于维生 第5章 不完全信息静态博弈及.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第5章不完全信息静态博弈及应用不完全信息静态博弈局中人的私人信息使得局中人不能确定对手的支付函数,称这种情况下的博弈为不完全信息博弈,如果参与人同时选择行动,这种博弈模型即为不完全信息静态博弈模型,也称为贝叶斯博弈。5.1海萨尼转换不完全信息的博弈问题在前两章所讨论的完全信息博弈模型中,局中人的支付函数是局中人的共同知识。在很多实际问题中,这是不可能的。这样,我们就面临着不完全信息的博弈模型。考虑具有如下支付矩阵的市场进入问题。设有两个局中人:市场潜在进入者和在位者。他们的生产成本可能是高成本H,也可能是低
2、成本L,但都不为对方所了解。支付矩阵如下:潜在H进入进不进入入L进入者不进入在位者HL默许抵制默许抵制úúúúúûùêêêêêëé----)40,0()40,0()16,2()20,20()40,0()40,0()16,10()15,10()20,0()20,0()8,2()10,15()20,0()20,0()8,10()10,10(局中人的支付函数可以表示为:(进入,默许;H,H)=10,(进入,默许;H,L)=10,(进入,默许;L,H)=15,(进入,默许;L,L)=20显然,对给定的行动组合,如(
3、进入,默许),局中人还不能确定自己以及对手的支付值,因为支付还依赖于对手的成本是H还是L。而局中人对于对手的这一私人信息还不了解,这样当然无法选择出对自己有利的策略。为解决这个问题,海萨尼提出了解决的方法—海萨尼转换。海萨尼转换1.海萨尼从不完全信息模型的特征入手,引入一个概念,类型:。称为局中人的类型空间或类型集合,称为局中人i的类型。对于局中人i而言是已知的,而对于其余局中人而言,是个随机变量。但的概率分布是共同知识。在前例中,局中人的支付函数是类型依存的,因而也是随机的。记为。这里是局中人的一个行动组
4、合。2.海萨尼在模型中引入一个虚拟局中人—“0”,称为“自然”。它的行动空间为,即n个局中人类型集合的乘积集合。“自然”所选择的行动是,即它为每个局中人i选择了类型3.海萨尼把静态博弈转化为动态博弈,博弈的时序为:(1)自然选择(2)自然把仅通知给局中人而不通知给其余局中人;(3)局中人同时选择行动。4.对给定的n+1个局中人的行动组合,局中人可获得支付。通过海萨尼转换,把信息不完全的静态博弈模型转化为信息完全但信息不完美的动态博弈模型。局中人的策略在贝叶斯博弈中,局中人是根据自己的类型选择行动的,因而局中
5、i人的策略是定义在局中人的信息集上,取值于行动集合的映射:局中人的条件期望支付函数由于局中人i的支付函数是随机的,因而需用期望支付作为决策的依据。对给定的其余局中人的策略组合及局中人i的行动,局中人i的(条件)期望支付为这里它描写了参与人i依据自己的类型对其余局中人类型的推断或信念。以下用表示贝叶斯博弈模型。贝叶斯纳什均衡称策略组合为不完全信息静态博弈的贝叶斯纳什均衡,对,固定,如果对,,最大化局中人i的条件期望支付,即注:以上定义是对于类型为离散型的随机变量而言的,如果类型为连续型的随机变量,求和号应改为
6、积分号。对于贝叶斯博弈模型,需用上述贝叶斯纳什均衡预测博弈的结果。5.2有限型贝叶斯博弈求解有限型贝叶斯博弈在贝叶斯博弈中,如果所涉及的集合、都是有限集,则称该模型是有限的。本节将通过几个例子,说明求解有限型贝叶斯均衡的方法与步骤。求解有限型贝叶斯均衡的方法与步骤例5.1不完全信息静态囚徒困境问题在囚徒困境问题中,设参与人1具有信息完全静态囚徒困境博弈中的理性选择偏好。局中人2的选择偏好为其私人类型。,表示他具有通常的理性选择偏好。,表示他更偏好于“抗拒”。t的概率分布为,是参与人的共同知识。支付矩阵为由海
7、萨尼转换,该模型的博弈树如图5-1所示,①①①①②②图5-1◎局中人1的策略集,局中人2的策略集。固定局中人1的策略c,求,最大化当,得。当,得。于是局中人2对于的最优反应为,或而对于局中人2的策略或。局中人1的策略反应行为是选择,最大化期望支付即求解最大化问题.即是参与人1关于的最优反应。故:是贝叶斯纳什均衡。类似,固定局中人1的策略D,求,最大化。当,。即。当,即。而对于,局中人1的最优反应是c,因而不是贝叶斯纳什均衡。例5.2在不完全信息的静态囚徒困境问题中,如果局中人1的偏好依赖于对手的类型,局中人
8、2的类型与上例相同。支付矩阵为经过海萨尼转换后的博弈树如图5-2所示。1.求参与人2关于参与人1的最优反应策略。固定,求,最大化参与人2的支付。可用在支付矩阵中划线的方法得到表5.1①①①①②②图5-2◎参与人2关于参与人1的最优反应策略为2.求参与人1关于参与人2的最优反应策略。对于固定的,参与人1选择,最大化自己的期望支付,即求解最大化问题,得表5.2当,参与人1关于参与人2的最优反应策略为,当,参与人1关于