经济博弈论考试复习

经济博弈论考试复习

ID:16191071

大小:148.00 KB

页数:6页

时间:2018-08-08

经济博弈论考试复习_第1页
经济博弈论考试复习_第2页
经济博弈论考试复习_第3页
经济博弈论考试复习_第4页
经济博弈论考试复习_第5页
资源描述:

《经济博弈论考试复习》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、经济博弈论考试复习一、1.什么是博弈论?“博弈论”译自英文“GameTheory”,直译就是“游戏理论”。是系统研究各种博弈问题,寻求在各博弈方具有充分或者有限理性、能力的条件下,合理的策略选择和合理选择策略时博弈的结果,并分析这些结果的经济意义、效率意义的理论和方法。博弈:一些个人、组织,面对一定的环境条件,在一定的规律下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。包括:博弈的参加者,各博弈方的全部策略或行为集合,进行博弈的次序,博弈方的得益四方

2、面。2.什么是纳什均衡?在博弈G=﹛,…,;,…,﹜中,如果由各个博弈方的各一个策略组成的某个策略组合(*,…,*)中,任一博弈方i的策略*,都是对其余博弈方策略组合(*,…,*,*,*,…*)的最佳对策,也即(*,…,*,*,*,…*)》(*,…,*,*,*,…*)对任意ϵ都成立,则称(*,…,*)为G的一个“纳什均衡”。(假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略,从而使自己利益最大化。所有局中人策略构成一个策略组合就是纳什均衡。这种策略组合由所有参与人最优策略

3、组成,即在给定别人策略的情况下,没有人有足够理由打破这种均衡。)3.什么是囚徒困境?囚徒困境的基本模型是这样的:警察抓住了两个合伙犯罪的罪犯。为了得到所需的口供,警察将这两名罪犯分别关押以防止他们窜供或结成攻守同盟:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判一年徒刑;如果两人中有一人坦白认罪,则坦白这从轻处理,立即释放,而另一人则将重判八年徒刑;如果两人同时坦白认罪,他们将各被判五年监禁。囚徒1坦白不坦白(囚徒2)坦白-5,-50,-8不坦白-8,0-1,-1双方的利益不仅取决于他们自己

4、的策略选择也取决于对方的策略选择。由于这两个囚徒不能串通,个人都追求自己的最大利益而不会顾及同伙的利益,又不敢相信对方,以此只能实现他们都不理想的结果。该博弈揭示了个体理性与团体立项之间的矛盾——从个体理性出发的行为往往不能实现团体的最大利益,最终也不能真正实现个体的最大利益,甚至会得到相当差的结果。二、1.什么是完全信息静态博弈?完全信息静态博弈是指各博弈方同时决策,且所有的博弈方对各方得益都了解的博弈。完全信息是指信息的充分性、对称性和透明性,静态是指同时决策,没有时间的差别。2.如何求解纳什均衡

5、?求解纳什均衡的4种方法:①离散、有限策略博弈:划线法②连续、无限策略博弈:反映函数法③零和博弈:最大最小法④循环相克博弈:混合战略(无差异原则)(1)离散有限——划线法通过在每个博弈方对其他博弈方每个策略或策略组合的最佳对策对应的得益下划线,分析博弈的方法称为“划线法”。例:囚徒的困境博弈囚徒1坦白不坦白(囚徒2)坦白-5,-50,-8不坦白-8,0-1,-1可以看出,只有策略组合(坦白,坦白)对应的得益系数(-5,-5)下面都划有短线,意味着只有这个策略满足双方的策略相互使对对方策略的最佳对策。就

6、是博弈的结果。划线法一策略之间的相对优劣为基础,在分析用得益矩阵表示的博弈问题时十分有普遍适用性。但事实上,也有许多博弈根本不存在确定性的结果,无法用这种方法。(2)连续无限——函数法(求导,建立拉格朗日方程)反应函数法:对一个一般的博弈,只要是得益是策略的多元连续函数,我们都可以求每个博弈方针对其他博弈方策略的最佳反应构成的函数,也就是反应函数,而解出的各个博弈方反应函数的交点就是纳什均衡。利用反应函数求博弈的纳什均衡的方法称为“反应函数法”设:Ux=Ux(x,y)Uy=Uy(x,y)x,y,Ux,

7、Uy连续,Ux,Uy二阶可微并且<0,<0,则求解反映函数:=0=0。其解即为Nash均衡例:养羊博弈模型(P67)局限性:1)对于不连续的得益函数无法用先求导数找出各个博弈方的反应函数的方法求纳什均衡,所以无法发挥作用。2)并不能保证各博弈方的反应函数有交点,特别是唯一的交点。(3)零和博弈1)有限离散策略——最大最小值法:X给出一个策略ax’,则y会给出一个行动ay’,使Ux(ax’,ay’)=minUx(ax,ay),而x要选择一个ax*,使Ux最大,Ux(ax*,ay*)=maxminUx(a

8、x,ay)=minmaxUx(ax*,ay*).y的一个策略ay,x却会选一个ax’使Ux最大,即Ux(ax’,ay)=maxUx(ax,ay),则y会选一个ay*使Ux(ax*,ay*)=minmaxUx(ax,ay)2)无限连续策略——反应函数方程(同上反应函数法)(4)循环相克博弈(混合战略)——无差异法1)所谓循环相克博弈是指博弈者的任何一项战略行为都受到对方某种战略的完全克制,对手之间的各个战略,形成相互克制的封闭环。如:“石头、剪子、布”游戏

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。