扩展型博弈和策略型博弈.ppt

扩展型博弈和策略型博弈.ppt

ID:52449102

大小:125.00 KB

页数:13页

时间:2020-04-07

扩展型博弈和策略型博弈.ppt_第1页
扩展型博弈和策略型博弈.ppt_第2页
扩展型博弈和策略型博弈.ppt_第3页
扩展型博弈和策略型博弈.ppt_第4页
扩展型博弈和策略型博弈.ppt_第5页
资源描述:

《扩展型博弈和策略型博弈.ppt》由会员上传分享,免费在线阅读,更多相关内容在PPT专区-天天文库

1、扩展型博弈和策略型博弈扩展性博弈和策略型博弈[一个简单例子]厂商1和2同时各自考虑是否引进产品A和B(替代产品)。对这类产品的市场需求情况如下:每阶段总需求量为20000或6000,概率各为0.4和0.6,如果两厂商同时生产,每个占一半市场销售额;完全垄断时价格为12,双头垄断时价格为10,价格上调时需求弹性极大,价格下调时需求弹性极小。厂商1的固定成本是40000,边际成本是5;厂商2的固定成本是60000,边际成本是3。扩展性博弈和策略型博弈[一个简单例子]厂商1和2同时各自考虑是否引进产品A和B(替代产品)。对

2、这类产品的市场需求情况如下:每阶段总需求量为20000或6000,概率各为0.4和0.6,如果两厂商同时生产,每个占一半市场销售额;完全垄断时价格为12,双头垄断时价格为10,价格上调时需求弹性极大,价格下调时需求弹性极小。厂商1的固定成本是40000,边际成本是5;厂商2的固定成本是60000,边际成本是3。图I.4:博弈树(讲义)基本定义一个扩展型博弈包含一个局中人集I,一个节点集T,一个有向线段集E,和一个赢得向量集V。每个有向线段的两个端点都是节点,依方向顺序一个叫始点,一个叫终点。如果从节点t始,经过一个接

3、一个的有向线段可以连接到节点t’,就称t’为t的后继点(或t是t’的先行点)。每个节点或是一个或多个有向线段的始点,并且/或者是一个有向线段的终点。不作为任何有向线段终点的节点叫做博弈始点,不作为任何有向线段始点的节点叫做博弈终点。基本定义将博弈始点通过一个接一个的有向线段连接到某个博弈终点,就得到一条博弈路径。每个博弈终点附上一个赢得向量,第i个分量表示局中人i的赢得。节点集T可以划分为两两不相交的若干个子集:其中每个局中人有一个,叫做他的决策节点集;自然界有一个(如果信息不完全),叫做机会节点集;还有一个子集包含

4、所有的博弈终点。每个局中人的决策节点集可以进一步划分为若干个两两不相交的信息集,每个信息集的节点用气球括起来或者用虚线连在一起,表示该局中人决策时不知道自己在那个节点上。基本定义从某局中人一个信息集的节点引出的每个有向线段表示他的“一着”,选定一着表示他在同一个信息集的所有节点选定同一个行动。一个局中人在每一个信息集都选定一着,就选定他的一个纯策略;即一个纯策略是一个完整的行动计划。局中人i的纯策略集用Si表示。每个局中人都选定一个纯策略,就构成一个策略横断面s(strategyprofile);这时可以算出博弈的一

5、个赢得向量或者一个期望赢得向量。全体纯策略横断面的集合记为S。基本定义不管博弈的动态过程,仅着眼于局中人,各人的纯策略和赢得,就得到博弈的策略型[I,S,V]。一个策略横断面s*=(s*1,…,s*n)叫做Nash均衡,如果对每个局中人i,他选定的策略s*i都是对所有其它局中人选定的策略s*-i的最优回应:pi(s*)pi(s*

6、si),siSi,iI。一个博弈不一定有纯策略Nash均衡;如果有,则不一定唯一。二人策略型博弈Nash均衡的计算可以按照定义找出所有的纯策略Nash均衡;如果策略型博弈比较复杂,

7、可以用策略间的“优”,“劣”关系化简,然后再寻找均衡。称i的一个策略si劣于si(或si优于si),如果不管其他人选定什么策略,si都比si使i得到更小的赢得。如果存在一个si,它优于i的任何其他策略,就称si为i的最优策略。显然,劣策略不可能构成Nash均衡。所以,寻找Nash均衡时可以把劣策略划掉以简化策略型博弈。混合策略Nash均衡当一个博弈没有纯策略Nash均衡时,人们考虑计算所谓混合策略Nash均衡。局中人的一个混合策略是指他按照某个概率分布随机地选用各个纯策略;如果他有K个纯策略,那么他的一个混合策略可以

8、表示为i=(pi1,…,piK),其中pik是他选用第k个纯策略的概率。当局中人使用混合策略时,各人的期望赢得等于他在每一个纯策略横断面上的赢得与该策略横断面出现的概率的乘积之总和。为简便计,i的期望赢得函数仍然用i表示。混合策略Nash均衡局中人i的全体混合策略的集合记为i;注意一个纯策略也可以看作一个特殊的混合策略。如果每个局中人都选用一个混合策略,就得到一个混合策略横断面。全体混合策略横断面的集合记为。一个混合策略横断面*=(*1,…,*n)叫做混合策略Nash均衡,如果如果对每个局中人i,他选

9、定的混合策略*i都是对所有其它局中人选定的混合策略*-i的最优回应:pi(*)pi(*

10、i),*ii,iI。混合策略Nash均衡Nash定理:任何有限的策略型博弈(局中人数目有限,每人的纯策略数目有限)至少存在一个混合策略Nash均衡(可能是纯策略Nash均衡)。一个博弈叫做有完整记忆的,如果每个局中人不会忘记他知道的信

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。