博弈论教学课件作者 姚国庆 论0-5章电子讲义博弈论-第四章.doc

博弈论教学课件作者 姚国庆 论0-5章电子讲义博弈论-第四章.doc

ID:50733872

大小:550.50 KB

页数:77页

时间:2020-03-07

博弈论教学课件作者 姚国庆 论0-5章电子讲义博弈论-第四章.doc_第1页
博弈论教学课件作者 姚国庆 论0-5章电子讲义博弈论-第四章.doc_第2页
博弈论教学课件作者 姚国庆 论0-5章电子讲义博弈论-第四章.doc_第3页
博弈论教学课件作者 姚国庆 论0-5章电子讲义博弈论-第四章.doc_第4页
博弈论教学课件作者 姚国庆 论0-5章电子讲义博弈论-第四章.doc_第5页
资源描述:

《博弈论教学课件作者 姚国庆 论0-5章电子讲义博弈论-第四章.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第四章完全信息动态博弈更为现实的考虑是将静态博弈动态化,动态化后,纳什均衡这一概念是否仍然有效呢?答案是部分有效的。如果不存在动态不一致,那么纳什均衡在完全信息动态博弈中仍不失为一个有用的均衡概念,但纳什均衡概念本身并不能保证不出现动态不一致,为了克服这一点在纳什均衡的基础上生产了所谓子博弈完美均衡。而这一章,我们将围绕这子博弈完美均衡来展开。第一节完美信息与完全但不完美信息完全信息动态博弈可以分为两类,即完美信息与完全但不完美信息。所谓的完美信息博弈,是指博弈中的后行动者始终能够观察到前行动者的

2、行动,因而动态博弈中不存在参与者同时行动这样的情况。而完全但不完美信息博弈,则指动态博弈中,至少存在两个参与者同时行动的情况,因而“后行动者”无法观察到“前行动者”的行动。我们不妨用两个例子来加以说明。例4.1动态囚徒困境招供沉默囚徒1囚徒2囚徒2招供沉默招供沉默图4-1动态囚徒困境例4.2取消管制维持取消进,进进,退退,进退,退1和2图4-2取消管制政府与图4-2完全等价的表示方法见图4-3。维持取消进退进退1图4-3取消管制政府2退进定义4.1完美信息动态博弈就是不存在同时行动的完全信息动态博

3、弈。显然,运用策略式来描述动态博弈会非常不便,特别是当信息不完全时更是如此,为了更简便地描述动态博弈,我们将引入一种新的博弈表达式——扩展式。第二节动态博弈的扩展式我们把博弈中所有从开始到结束的行动序列称为全历史(Terminalhistory),而用参与者函数来表示在每一个全历史上,在博弈进行到某个阶段时谁来行动。因而要完整地描述一个动态博弈,必须具备四个要素:(1)参与者集合;(2)全历史集合;(3)参与者函数;(4)偏好。如果我们把全历史表示成一个行动序列(a1,a2,…,aK)(K为自然数

4、,当时,就表示无穷动态博弈),那么(a1,a2,…,am),其中,就称为全历史(a1,a2,…,aK)的子历史(Subhistory)。当m

5、,H为博弈的全历史集合,即H={(a1,a2,…,aK)},其中K为博弈从开始到结束依次发生的行动次数,行动序列中的每一个a都为向量。P为参与者函数,即P(h)={i:i∈N},。u为收益函数,表示博弈参与者的偏好。与博弈的基本式相比,扩展式没有直接给出博弈参与者的行动集合,原因在于扩展式已经隐含地定义了各参与者在行动时有些什么样的行动可供选择,根据全历史和参与者函数,能很容易地得到各参与者的行动集合。在历史h之后,参与者P(h)所有可能的行动集合定义为AP(h)(h)={aP(h):(h,a)是

6、一个子历史,aP(h)是行动向量a的第P(h)个元素}例如,在取消管制博弈中,根据全历史集合H和参与者函数P()=政府,P(取消)={1,2},可知A()={维持,取消},即政府有两个行动——维持和取消;A1(取消)={进,退}和A2(取消)={进,退},即两个企业各有两个行动——进和退。需要注意的是,在完美信息下,扩展式有三个地方与完全但不完美信息不同。首先,历史h由行动向量序列变为行动序列,例如,在取消管制中,历史(取消,[进,进])是一个向量序列,因为企业1和企业2是同时行动的,如果改成企业

7、2后行动,那么就变成(取消,进,进),也就是由一个向量序列便成了单值序列,意思也完全不一样了。其次,参与者函数P(h)都是单点映射,对应着唯一一位参与者。最后,就是行动集合A可以省略下标,因为A(h)={a:(h,a)是一个子历史}。现在我们将例4.1和例4.2的扩展式表达如下:例4.1动态囚徒困境的扩展式为,其中(1)参与者集合:囚徒1和囚徒2,N={1,2}。(2)全历史集合:招供为C,沉默为S,H={(C,C),(C,S),(S,C),(S,S)}。(3)参与者函数:P()=1,P(C)=P

8、(S)=2。(4)偏好:对于囚徒1而言,最好的历史是(C,S),其次为(C,C),然后为(S,S),最倒霉的历史为(S,C)。对囚徒2而言,最好的历史是(S,C),其次为(C,C),第三为(S,S),最差为(C,S)。例4.2取消管制的扩展式为,其中(1)参与者集合:政府,企业1和企业2,N={1,2,3}。(2)全历史集合:维持为C,取消为D,进入为E,退出为Q,那么全历史集合H={(C),(D,[E,E]),(D,[E,Q]),(D,[Q,E]),(D,[Q,Q])。(3)参与

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。