《博弈论:原理、模型与教程》第02章--Nash-均衡--第01节--占优行为.doc

《博弈论:原理、模型与教程》第02章--Nash-均衡--第01节--占优行为.doc

ID:57672270

大小:210.00 KB

页数:8页

时间:2020-08-31

《博弈论:原理、模型与教程》第02章--Nash-均衡--第01节--占优行为.doc_第1页
《博弈论:原理、模型与教程》第02章--Nash-均衡--第01节--占优行为.doc_第2页
《博弈论:原理、模型与教程》第02章--Nash-均衡--第01节--占优行为.doc_第3页
《博弈论:原理、模型与教程》第02章--Nash-均衡--第01节--占优行为.doc_第4页
《博弈论:原理、模型与教程》第02章--Nash-均衡--第01节--占优行为.doc_第5页
资源描述:

《《博弈论:原理、模型与教程》第02章--Nash-均衡--第01节--占优行为.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、《博弈论:原理、模型与教程》第一部分完全信息静态博弈第2章Nash均衡本章将通过分析理性参与人在博弈中的选择行为,探讨完全信息静态问题的求解,并给出完全信息静态博弈的解—Nash均衡。2.1占优行为(已精细订正!)首先考察博弈论中最为经典的一个博弈模型—“囚徒困境”(prisoners’dilemma)博弈。两个小偷作案后被警察抓住,分别关在不同的屋子里审讯。在审讯之前,小头偷从律师那里得知:如果两个人都坦白,将被个判刑8年;如果两个人都抵赖,将会因为证据不足而各判年;如果其个一人坦白另一人抵赖,坦白的讲将会得到宽大处理而被无罪释放,而抵

2、赖的将被重刑,判刑年。试问两个小偷将会如何选择?上述“囚徒困境”博弈问题是Tucker在20世纪50年代提出的,该问题不仅“可以作为实际生活中许多现象的一个抽象概括”,而且对它的研究在一定程度上也奠定了非合作博弈论的理论基础。在“囚徒困境”博弈问题中,参与人是两个小偷,参与人的战略都是:坦白和抵赖,支付就是在各种选择下所得到的刑期。图2-1给出了“囚徒困境”博弈问题的战略式描述。小偷2小偷1坦白抵赖抵赖坦白0,-6-4,-4-1,-1-6,0图2-1“囚徒困境”博弈显然,在“囚徒困境博弈”中,小偷选择的结果不仅与自己的选择有关,而且与另一

3、小偷的选择有关,那么小偷如何选择呢?8不妨这样考虑小偷的决策过程:假设对方坦白,自己该怎么做;假设对方抵赖,自己应该怎么做。也就是,给定另一小偷的决策,寻找自己的最优决策。对于每个小偷,当对方坦白时,自己坦白得,抵赖得,所以应该选择“坦白”;而当对方抵赖时,自己坦白得,抵赖得,所以还是应该选择“坦白”。也就是说,无论对方如何选择,每个小偷都会选择“坦白”。因此,博弈的结果就是两个小偷都选择“坦白”。两个小偷都选择“坦白”,这样的结果似乎与我们的直觉相矛盾。因为在“囚徒困境”的种结果(即、、、)中,虽说不能肯定这个结果是最差的,但它显然不如

4、。这是因为导致两个小偷都得,而却能使大家都得,也就是说,是Pareto优于的。既然选择“抵赖”对双方都有好处,那么两个小偷是否都会选择“抵赖”呢?只要小偷是前面所假设的完全理性的参与人,答案就是否定的。不妨假设两个小偷都选择“抵赖”,现在分析小偷的这种选择是否是理性的。对小偷1而言,小偷2选择“抵赖”8的情况下,自己选择“抵赖”得,选择“坦白”得,显然“坦白”优于“抵赖”。因此,理性的小偷1将会偏离“抵赖”而选择“坦白”。基于同样的原因,理性的小偷2也会偏离“抵赖”而选择“坦白”。除了和以外,“囚徒困境”是否会出现其他结果呢?比如说一个人

5、坦白,一个人抵赖?我们说这样的结果也是不会出现的,因为在对方选择“坦白”的情况下,自己选择“抵赖”显然是不理性的。剩下的问题是:当两个小偷都选择“坦白”时,是否有人偏离“坦白”而选择“抵赖”。基于同样的分析,两个小偷只要是理性的,这种情况就不会发生也许有人会问:如果两个小偷在被抓之前就制定攻守同盟,决定双方选择“抵赖”,这是否可以是博弈的结果为呢?这要取决于“攻守同盟”对双方是否具有约束力,是否对双方的支付产生影响。只要这种“攻守同盟”对双方的选择没有约束力,不能对违背协议(即“攻守同盟”)的参与人的支付产生影响,理性的参与人都会选择偏离

6、“抵赖”而选择“坦白”。。因此,虽然结果是结果的Pareto改进(即所有的人都得到好处),但只要两个小偷是理性的,这种对所有人都有好处的“改进”两人都无法得到。这也反映出现实生活中经常出现的“个人理性与集体理性间的矛盾”。8事实上,“囚徒困境”在现实生活中有着许多应用。也许“囚徒困境”博弈是人们虚构出来的一个博弈模型,但在现实生活中与“囚徒困境”相似的情形却很多。例如,寡头垄断市场上厂商间的价格大战,就是典型的“囚徒困境“。20世纪90年代末期我国出现的彩电企业间的价格大战就是这种情形,还有目前人们议论比较多的有关中小学生教育方式的选择。

7、家长明知道素质教育对孩子的长远发展更有益处,但为了应付各种各样的升学考试,也不得不让孩子参与各种名目的“模拟考试”或“考试培训”,这也是典型的“囚徒困境”。诸如此类的例子,现实生活中还有很多。进一步分析“囚徒困境”中小偷的战略,可以发现战略“坦白”具有这样的特点:无论对方怎样选择(选择“坦白”或者“抵赖”),“坦白”总是理性小偷的最优战略。考察更一般的人博弈情形。人博弈中,参与人的支付既与自己的选择有关,也与其他参与人的选择有关。因此,在一般情况下,使某参与人的支付最大化的最优战略与其他参与人的选择有关。但在某些特殊情况下,如8“囚徒困境

8、”博弈中,可能会出现这样的情况:参与人的最优战略与其他人参与人的无关。也就是说,无论其他参与人选择什么战略,参与人的最优战略总是唯一的。这样的最优战略称为“占优战略”(dominantstra

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。