博弈论第三章完全信息动态博弈ppt课件.ppt

博弈论第三章完全信息动态博弈ppt课件.ppt

ID:59341249

大小:279.00 KB

页数:60页

时间:2020-09-20

博弈论第三章完全信息动态博弈ppt课件.ppt_第1页
博弈论第三章完全信息动态博弈ppt课件.ppt_第2页
博弈论第三章完全信息动态博弈ppt课件.ppt_第3页
博弈论第三章完全信息动态博弈ppt课件.ppt_第4页
博弈论第三章完全信息动态博弈ppt课件.ppt_第5页
资源描述:

《博弈论第三章完全信息动态博弈ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第三章完全信息动态博弈3.1动态博弈的表示法和特点定义与博弈树博弈的展开式所包含的信息和内容:⑴参与人的集合,记为i=1,2,…n,用N代表虚拟的参与人“自然”;⑵行动的次序,即谁在什么时候行动;⑶参与人的行动空间,即轮到某参与人行动时,他从该时刻的纯策略空间中选取什么策略;⑷当参与人作出他们的行动决策时,他所观测到或他所了解到的信息,即他在此时获得的信息集合;⑸参与人的得益(支付或效用),它们是已知行动的函数;⑹在任何外生事件的概率分布。例房地产开发博弈有两个房地产开发商(分别为参与人1,记为A和参与人2,记为B)在某地开发房地产,但该地的房地产需求状况是不确定的,假定该博弈的行动顺序如下:

2、(1)开发商1先行动,选择开发或不开发;(2)在1决策后,“自然”选择需求的大小;(3)开发商2在观测到1的决策和市场的需求后,再决定开发或不开发。(如下图)房地产开发博弈ANNBBBB开发不开发需求大需求小需求大需求小开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)单位:百万元hA(1)hN(1)hN(2)hB(1)hB(2)hB(3)hB(4)h表示信息集上述博弈树给出了有限博弈的几乎所有信息。博弈树必须满足下列规则:每一个结(node)至多有一个其他结直接位于它的前面;在博弈中没有一条路径可以使决策集与自身相连;

3、每一个结是唯一初始结的后续结,即博弈树必须有初始结;每个博弈树“正好”只有一个初始结(多于一个可以用“自然”连接。不允许出现的情况:由以上规则,对于博弈树中的每一个终点结,我们,完全可以确定从初始结到终点结的路径,同时也展示了博弈的动态过程。信息集:博弈树上的所有决策集分割成不同的信息集,我们用h∈H来表示这个信息。如果一个信息集包含结x,我们就可以将该信息集记为h(x),如果一个信息集只包含一个结,这是最简的情况。我们主要关心的是一个信息集包含不止一个结,假设x与x′∈h(x),则恰好拥有信息h(x)并正在选择自己行动的参与人其实对自己究竟是处于x还界x′是不确定的。要求:如果x′∈h(x)

4、,则x与x′应该由同一个参与人采取行动,且可以选择的策略空间相同:A(x)=A(x′),由此可以将信息集h上的行动集记为A(h)。如果博弈树的所有信息集都是单结的,则称该博弈为完美(perfect)息博弈。(无虚线连接),而完全(complete)信息博弈是指得益函数和纯策略空间均为博弈各方的共同知识。完全信息可以是完美的也可以是不完美的。3.2展开型博弈的策略与均衡一、行为策略在策略型博弈中,参与人的策略是进行博弈的计划(或打算)的详细集合,而在展开型博弈中参与人的策略必须确定在该参与人的每一个决策集上所采取的行动,又结与信息集紧密相连,对于参与人i,基于信息hi的行动的的全体记汉A(hi)

5、,如果令Hi表示参与人i的信息集的集合,则Ai=∪A(hi)就是参与人i的所有行动的集合。参与人i的一个纯策略是从Hi到Ai的一个映射si:对每一个hi∈Ai,si(hi)∈Ai,所有这些si的全体记为Si,即的的纯策略空间Si,由此:Si=×A(hi)hi∈Hihi∈Hi例参与人2有两个策略集,相应地也有两个信息集A(h2(1))=A(h2(2))={左,右}1221111上下左右左右ABABCDCDh2(1)h2(2)h1(1)h1(2)h1(3)其中H2={h2(1),h2(2)};参与人2的纯策略空间为:S2=(A(h2(1)),Ah2(2))={(左,右)×(左,右)}={(左,左)

6、,(左,右),(右,左),(右,右)},其中纯策略(左,左)表明:当1取“上”时,2取“左”;当1取“下”时,2取“左”,……参与人1有三个信息集H1={hi(i),i=1,2,3},1的纯策略空间为:S1=A(h1(1))×A(h1(2))×A(h1(3))={(上,下)×(A,B)×(C,D)},共8种纯策略。一般地,参与人I的纯策略空间的纯策略数目为:#Si=Π#(A(hi))hi∈Hi展开型博弈中纯策略是由信息集与行动集定义的(与静态博弈不同,静态博弈中采取纯策略与采取某行动是一个意思)。纯策略组合(剖面profile)是由参与人各自的纯策略空间中的任一纯策略构成的组合,在任一纯策略组

7、合s下,总可以从初始结开始,沿着博弈树的某条路径(path),达到s相应的终点结。有一个事实非常重要:s中有些信息集在博弈树的这条路径上,我们称这些信息集是s的路径(path),当然也可能存在s中某些信息集不在此路径上。定义了纯策略的得益函数后,我们就可以定义展开型博弈的Nash均衡;定义策略组合s*=(s1*,…si*,…sn*)是展开型博弈的一个Nash均衡,如果对每一个i,si*最大化ui(

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。