博弈树与逆向归纳法1

ID：6708974

大小：45.80 KB

页数：15页

时间：2018-01-23

资源描述：

《博弈树与逆向归纳法1》由会员上传分享，免费在线阅读，更多相关内容在应用文档-天天文库。

1、动态博弈与逆向归纳法假如欺负他人可以获得快乐，那你会欺负他人吗？大多数人的回答是不会，原因正如他们所指出的，欺负他人会担心他人的报复，这抵消了从欺负他人的行为中所能得到的快乐。这个答案至少表明，你之所以现在没有欺负他人，并不因为不想欺负他人，而是因为你知道欺负他人会在将来给自己造成麻烦。同样，当我们面临一些博弈对局的时候，我们应如何采取现在的行动，常常取决于每个行动在将来会产生什么后果，或者说在将来别人将如何反应。在前面各章内容中，博弈是静态的——或者说是同时行动的。而现实中的博弈常常是动态的、依

2、序行动的，这就要求我们必须考虑人们在将来对我们的行动反应。分析序贯行动博弈的一个重要思路就是：向前展望，向后推理(lookingforwardandreasoningbackward)，即面向未来，思考现在，站在未来的立场来确定现在的最优行动。本章我们将通过一些例子来说明这一分析思路，其中有些例子很有趣，也很有挑战性。§5-1逆向归纳法1、美中军事政治博弈我们通过一个简单的例子来说明序贯博弈的（离散策略的）扩展式表达和逆向归纳法求解方法。这个例子可以称做美中军事政治博弈，或者叫“毛泽东的对外军事政

3、治战略”。故事模型在我国解放初期，美国一直试图对我国实施打击。此时，我国必须对美国采取应对之策。就我国对美国可以采取的行动而言，无非是回击或不回击。用更符合毛泽东的话来说，美国可以“犯我”或“不犯我”，而我们可以“犯人”或“不犯人”。由此我们可以刻画出一个动态博弈：●博弈方：美国、中国；●行动空间：美国可选择的行动是“犯我”或“不犯我”；中国的选择是“犯人”或“不犯人”；●行动顺序：美国先行动；中国观察到美国的行动后再选择自己的行动；●赢利：我们这样假设赢利状况（数字是虚拟的）；●如果美国“犯我”

4、，中国“犯人”，恶战再所难免，则美国亏损2，中国15亏损2；●如果美国“犯我”，中国“不犯人”，那么中国沦为美国的附庸，丧失国家主权，则美国获得2，中国亏损4；●如果美国“不犯我”，中国“犯人”，那么就是中国挑起战事，美国正好有借口纠合国际力量打击中国，则美国得3，中国亏损5；●如果美国“不犯我”，中国“不犯人”，各自和平地发展经济，则美国得1，中国得1。2、博弈树对于上述动态博弈，我们可以用博弈树(gametree)表达如下（图5-1）：美国犯我不犯我中国中国犯人不犯人犯人不犯人（－2，－2）（

5、2,-4）（3,-5）（1,1）图5-1美中军事政治博弈图5-1的博弈树是这样解读的：美国先选择“犯我”或“不犯我”，然后中国观察美国的选择后选择“犯人”或“不犯人”；最右边的括号内数字是各种情况下双方的赢利状况，前一个数字代表第一个行动人（美国）的赢利，第二个数字代表第二个行动人（中国）的赢利。依此类推，如果有更多的参与人序贯行动，则赢利的排列顺序与行动顺序一致。3、逆向归纳法究竟什么是图5-1博弈的均衡呢？在完美信息动态博弈中，我们要找的均衡实际上是一条路径，即从第一个行动人决策结点出发，一直

6、到某一个终点之间的路径。所谓均衡路径就是在每一个决策阶段，没有人会偏离这条路径。这条路径所代表的策略均衡被称做子博弈完美均衡。下面我们介绍如何用逆向归纳法来求解博弈的均衡。逆向归纳的步骤是这样的：●首先，从最后阶段行动的参与人决策开始考虑。在图5-1的博弈中，最后行15动的是中国，因此我们先考虑中国怎么决策。在考虑中国的决策时，我们假定美国已经选了“犯我”或“不犯我”；◆如果美国选择了“犯我”，在图5-1中可发现，中国选择“犯人”会得到-2，选择“不犯人”会得到-4；因此中国必然选择“犯人”——我

7、们就在中国“犯人”的分枝上画上一个短短的横线标记；◆如果美国选择了“不犯我”，从图5-1中可发现，中国选择“犯人”会得到-5，选择“不犯人”会得到1，因此中国必然选择“不犯人”——我们就在中国“不犯人”的分枝上画上一个短短的横线标记。●然后，考虑次后阶段行动的人（例子中只有两个阶段，因此实际上就是第一阶段行动的人）——美国。美国决策时会考虑中国的反应，而现在它已预见到中国将选择的行动就是两条划了双横线的分枝。所以，它很容易推出自己面临的情况是：◆若选择“犯我。，则必然导致中国“犯人”，则美国得到-

8、2；◆若选择“不犯我”，则中国必选择“不犯人”，则美国得到1；◆结果美国宁愿选择“不犯我”。照规矩，我们在美国“不犯我”的一个分枝上画上横线。●如果存在一个路径，其每个分枝都画上了横线，那么这条路径就是均衡路径。可发现，在图5-1的例子中，均衡路径将是美国选择“不犯我”，而中国选择“不犯人”。因此，美中博弈的子博弈完美均衡结果是：美国不侵犯中国，而中国也不侵犯美国。逆向归纳法对于求解子博弈完美均衡之所以适用，其原因就在于它的解过程很好地体现了子博弈完美均衡的定义：一个策略组合只有在

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 15



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

博弈树与逆向归纳法1

博弈树与逆向归纳法1

相关文章

相关标签