欢迎来到天天文库
浏览记录
ID:6708974
大小:45.80 KB
页数:15页
时间:2018-01-23
《博弈树与逆向归纳法1》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、动态博弈与逆向归纳法假如欺负他人可以获得快乐,那你会欺负他人吗?大多数人的回答是不会,原因正如他们所指出的,欺负他人会担心他人的报复,这抵消了从欺负他人的行为中所能得到的快乐。这个答案至少表明,你之所以现在没有欺负他人,并不因为不想欺负他人,而是因为你知道欺负他人会在将来给自己造成麻烦。同样,当我们面临一些博弈对局的时候,我们应如何采取现在的行动,常常取决于每个行动在将来会产生什么后果,或者说在将来别人将如何反应。在前面各章内容中,博弈是静态的——或者说是同时行动的。而现实中的博弈常常是动态的、依
2、序行动的,这就要求我们必须考虑人们在将来对我们的行动反应。分析序贯行动博弈的一个重要思路就是:向前展望,向后推理(lookingforwardandreasoningbackward),即面向未来,思考现在,站在未来的立场来确定现在的最优行动。本章我们将通过一些例子来说明这一分析思路,其中有些例子很有趣,也很有挑战性。§5-1逆向归纳法1、美中军事政治博弈我们通过一个简单的例子来说明序贯博弈的(离散策略的)扩展式表达和逆向归纳法求解方法。这个例子可以称做美中军事政治博弈,或者叫“毛泽东的对外军事政
3、治战略”。故事模型在我国解放初期,美国一直试图对我国实施打击。此时,我国必须对美国采取应对之策。就我国对美国可以采取的行动而言,无非是回击或不回击。用更符合毛泽东的话来说,美国可以“犯我”或“不犯我”,而我们可以“犯人”或“不犯人”。由此我们可以刻画出一个动态博弈:●博弈方:美国、中国;●行动空间:美国可选择的行动是“犯我”或“不犯我”;中国的选择是“犯人”或“不犯人”;●行动顺序:美国先行动;中国观察到美国的行动后再选择自己的行动;●赢利:我们这样假设赢利状况(数字是虚拟的);●如果美国“犯我”
4、,中国“犯人”,恶战再所难免,则美国亏损2,中国15亏损2;●如果美国“犯我”,中国“不犯人”,那么中国沦为美国的附庸,丧失国家主权,则美国获得2,中国亏损4;●如果美国“不犯我”,中国“犯人”,那么就是中国挑起战事,美国正好有借口纠合国际力量打击中国,则美国得3,中国亏损5;●如果美国“不犯我”,中国“不犯人”,各自和平地发展经济,则美国得1,中国得1。2、博弈树对于上述动态博弈,我们可以用博弈树(gametree)表达如下(图5-1):美国犯我不犯我中国中国犯人不犯人犯人不犯人(-2,-2)(
5、2,-4)(3,-5)(1,1)图5-1美中军事政治博弈图5-1的博弈树是这样解读的:美国先选择“犯我”或“不犯我”,然后中国观察美国的选择后选择“犯人”或“不犯人”;最右边的括号内数字是各种情况下双方的赢利状况,前一个数字代表第一个行动人(美国)的赢利,第二个数字代表第二个行动人(中国)的赢利。依此类推,如果有更多的参与人序贯行动,则赢利的排列顺序与行动顺序一致。3、逆向归纳法究竟什么是图5-1博弈的均衡呢?在完美信息动态博弈中,我们要找的均衡实际上是一条路径,即从第一个行动人决策结点出发,一直
6、到某一个终点之间的路径。所谓均衡路径就是在每一个决策阶段,没有人会偏离这条路径。这条路径所代表的策略均衡被称做子博弈完美均衡。下面我们介绍如何用逆向归纳法来求解博弈的均衡。逆向归纳的步骤是这样的:●首先,从最后阶段行动的参与人决策开始考虑。在图5-1的博弈中,最后行15动的是中国,因此我们先考虑中国怎么决策。在考虑中国的决策时,我们假定美国已经选了“犯我”或“不犯我”;◆如果美国选择了“犯我”,在图5-1中可发现,中国选择“犯人”会得到-2,选择“不犯人”会得到-4;因此中国必然选择“犯人”——我
7、们就在中国“犯人”的分枝上画上一个短短的横线标记;◆如果美国选择了“不犯我”,从图5-1中可发现,中国选择“犯人”会得到-5,选择“不犯人”会得到1,因此中国必然选择“不犯人”——我们就在中国“不犯人”的分枝上画上一个短短的横线标记。●然后,考虑次后阶段行动的人(例子中只有两个阶段,因此实际上就是第一阶段行动的人)——美国。美国决策时会考虑中国的反应,而现在它已预见到中国将选择的行动就是两条划了双横线的分枝。所以,它很容易推出自己面临的情况是:◆若选择“犯我。,则必然导致中国“犯人”,则美国得到-
8、2;◆若选择“不犯我”,则中国必选择“不犯人”,则美国得到1;◆结果美国宁愿选择“不犯我”。照规矩,我们在美国“不犯我”的一个分枝上画上横线。●如果存在一个路径,其每个分枝都画上了横线,那么这条路径就是均衡路径。可发现,在图5-1的例子中,均衡路径将是美国选择“不犯我”,而中国选择“不犯人”。因此,美中博弈的子博弈完美均衡结果是:美国不侵犯中国,而中国也不侵犯美国。逆向归纳法对于求解子博弈完美均衡之所以适用,其原因就在于它的解过程很好地体现了子博弈完美均衡的定义:一个策略组合只有在
此文档下载收益归作者所有