标准型对策的纳什解求法

标准型对策的纳什解求法

ID:44429576

大小:105.17 KB

页数:3页

时间:2019-10-22

标准型对策的纳什解求法_第1页
标准型对策的纳什解求法_第2页
标准型对策的纳什解求法_第3页
资源描述:

《标准型对策的纳什解求法》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、标准型对策的纳什解求法当局屮人的战略空间很人时,根据定义来检査每个战略组合是否是纳什均衡是困难的,因此,我们常常集中比较形象直观的方法。A.划线法:即通过在每一博弈方针对对方每一策略的瑕大口J能得益下划线,如果每个得益数字下都划有短线的组合就是该博弈的解。而如果得益矩阵中不存在所有数字下都划有短线的得益数组,就意味着该博弈不可能有确定(或稳定)的解。这就需要用到进一步的混合策略分析。画线法的分析主要适用于静态博弈,例如下而的I人1徒博弈(囚徒困境是社会科学领域的典型版本,它体现在众多的团队活动中,如公共品的供给不足、公地的悲剧、团队牛

2、产中的偷懒等):囚徒1不坦白坦白徒不坦白1,110,02坦白0,105,5【人I従闲境另外,纳什均衡也有强弱之分,而上述定义给出的是弱纳什均衡定义。强纳什均衡是指,如果给定其他局小人的战略,每个局中人的最优选择是唯一的,强纳什均衡对博弈支付矩阵的小小变化并不敏感;而在弱纳什均衡下,有些局中人可能在均衡战略和非均衡战略Z间是无差异的。如下博弈:乙上中下4,103,83,102,102,82,92,102,82,12显然,上述博弈存在两个均衡,但没有一个均衡是强纳什均衡。B.箭头法:通过反映博弈方选择倾向的箭头寻找稳定性的策略组合求解博弈

3、的方法。思路:对博弈中的每个策略组合,判断各博弈方能否通过单独改变自C的策略而改善自C的得益,如能,则从所考察的策略组合的得益引一•箭头到改变策略后的策略纽合对应的得益;如果不存在任何指离它的得益的箭头而只有指向该处的箭头,它就是I専弈的稳定策略组合。丈夫足球歌舞◄—^2,4T0,0

4、1,1▼4,2-►性别之战妻足球子歌舞C.严格劣策略消去法:也就是把某博弈方的严格下策反复去掉,在剩下的较小空间中进行分析,直到惟一的一个策略组合幸存下来,它就是博弈的解。7,76,67,65,75,88,56,65,84,8上甲中下按照甲下、乙下、甲中

5、、乙小的顺序剔除后,我们就得到(上、上)均衡。但是,要注意的是,重复剔除占优战略均衡只有在重复剔除劣战略最终只剩下唯-一个点吋才出现。同时,我们剔除的是严格劣战略,如果剔除的是弱劣战略,就有可能将部分纳什均衡剔除掉,并引起混乱。如将上而博弈矩阵作适当变化上T中下7,76,56,75,85,75,65,76,55,8乙上中下显然,按照乙屮、甲屮、乙上、甲下剔除,可以得到(上,下)均衡;而如果按照甲下、乙下、甲中、乙中剔除,对以得到(上,上)均衡;而根据划线法可知,两个都是纳什均衡。A.无限策略空间求解上述2*2醇弈川的划线法等很容易推广

6、到两人有限策略空I'可的I専弈中去,只不过在每次划线时要比较多个盈利的大小;但是,如果策略空I'可是无限的,就无法施川了。事实上,我们上面考虑的策略空间是离散的,现在假设两个局屮人的纯策略空间是一元变量的连续区I'可,这时显然划线法是不适用的。为此,我们还是纳什均衡的定义着手。反应函数:实际上,纳什均衡就是各局中人的一组互为最佳反应对策的策略:每个局中人针对对方的每种策略找出一最佳反应策略,在双方的无数反应策略中的交叉点就构成了纳什均衡;一•燉地,我们将每个局中人对其他局中人所有策略的最佳反应构成的函数称为“反应函数”。我们以古诺模型

7、为例:在古诺模型中,每个厂商依据竞争对手既定产量选择最优的产量。我们假设:在一个有n个竟争厂商的同质产品市场,市场反需求函数p(X);二旺,Xi是单个厂商的产量;厂商的成木函数Ci(xJ。凶此,在战略组合x=(xhx2……,xj厂商的利润函数为:兀i(x)=Xip(X)-Ci(Xi)最大化有:込型=p(X)+x”(X)-c;(x.)=Odx-°匚半=2/AX)+x”(X)-c;(xj

8、表明任何厂商的最优产量都是其竟争对手的产量函数,因此,这称为反应函数(reactionfunction)。联立反应函数求解就得出纳什均衡的产量。反应曲线:实际上,我们可也以将博弈的策略组合用平面上的点來表示,平面上的每一点都反映了两人博弈的结局;局中人1的策略空间用XM0表示,局中人2的策略空间用YN0表示。显然,从局中人2出发,局中人1每一个策略X的选择,局中人2的最佳反应策略Y都随之变动,在平而上将这些点连起来就得到的曲线实质上就反映了局中人2关于局中人1所选策略的最佳反应,我们称之为反应曲线;类似地,也可以得到局屮人1相对于局屮

9、人2的反应曲线。一般地,两条曲线在平血上会有交点,交点表明两个局中人都对对方的策略作fllTM佳反应,也就是纳什均衡。在古诺模型中,上述的反应函数描绘在几何图形就得到了反应曲线。而且,一般地曲线是向下倾斜的,即有:一热—

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。