完全信息动态博弈(博弈论张醒洲).ppt

完全信息动态博弈(博弈论张醒洲).ppt

ID:51995695

大小:1005.00 KB

页数:24页

时间:2020-03-27

完全信息动态博弈(博弈论张醒洲).ppt_第1页
完全信息动态博弈(博弈论张醒洲).ppt_第2页
完全信息动态博弈(博弈论张醒洲).ppt_第3页
完全信息动态博弈(博弈论张醒洲).ppt_第4页
完全信息动态博弈(博弈论张醒洲).ppt_第5页
资源描述:

《完全信息动态博弈(博弈论张醒洲).ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、2009-03-09张醒洲大连理工1完全信息动态博弈Unit3-12009-03-09张醒洲大连理工2第3章和第4章概要博弈分类举例解的概念简单的完全且完美信息动态博弈双寡头垄断模型(1934)讨价还价模型(1982)后向归纳结果(BIO)2人两阶段重复博弈(“同时行动”意味着“不完美信息”)Lazear&RosenTournaments(1981)工作竞赛模型SubgamePerfectOutcome(SPO)子博弈完美结果动态博弈主题:可信威胁与承诺会影响现在的行为下一次博弈开始前的所有博弈的结果都能被观察到的重复博弈Subgame-perfectNashequilibrium子博弈完美N

2、E2009-03-09张醒洲大连理工3第3章概要完全信息动态博弈Representation表述Normal-form/Strategic-form标准式/策略式Extensive-form扩展式Solutionconcepts解的概念NashEquilibrium(NE)Nash均衡Subgame-perfectNashequilibrium(SPNE)子博弈完美Nash均衡CentralIssue中心问题credibilitythreatsorpromise(self-enforcement)可信性威胁或承诺Theme主题思想一个完全信息动态博弈可能会有很多个纳什均衡,但是有些均衡包含了不

3、可置信的威胁和承诺。子博弈完美纳什均衡就是通过了可信任检测的均衡。2009-03-09张醒洲大连理工4简单类型的完全且完美信息博弈两人博弈类型参与人1从可行集A1中选择一个行动a1;参与者2观察到a1并从可行集A2中选择行动a2;两人的收益分别为u1(a1,a2)和u2(a1,a2)。Ex.斯塔克尔贝里(1934)双寡头垄断模型Tool后向归纳法Anticipation后向归纳结果2009-03-09张醒洲大连理工5理论:后向归纳法简单的完全且完美信息博弈(CPI)两个参与人,同时行动完全且完美信息举例:斯塔克尔贝里(1934)双寡头垄断模型为了使模型更加一般化,允许更长的行动序列(可以加入更

4、多的参与人或允许参与人行动多于一次)一个例子.鲁宾斯坦的讨价还价博弈为解决简单类型的CPI,应用后向归纳法求解的过程如下:2009-03-09张醒洲大连理工6理论:后向归纳法(续)第1步:分析第二阶段博弈参与人2的问题:对参与人1的行动a1选择最优的反应R2(a1),参与人2面临的最优化问题是:即2009-03-09张醒洲大连理工7理论:后向归纳法(续)请注意这个问题对两个参与人来说是一个共同知识。因此参与人1可以预测到参与人2对他的行动a1所做出的反应R2(a1)。第2步:分析第一阶段参与人1的问题:对参与人2的最优反应R2(a1),选择最优的行动a1:即2009-03-09张醒洲大连理工8

5、理论:后向归纳法(续)定义.简单的完全且完美信息博弈的后向归纳结果是(a1*,R2(a1*)。注意到后向归纳结果不包括不可置信的威胁–参与人1预测到参与人2是理性的,也就是2会对1可能选择的A1中的任何行动a1作出最优反应R2(a1);–并且,参与人1认为参与人2不会选择不符合自身利益的行动。下面看一个例子2009-03-09张醒洲大连理工9后向归纳法内在的理性假定一个两个人的三阶段博弈1.参与人1选择L或R,其中L使博弈结束,参与人1的收益为2,参与人2的收益为0;2.参与人2观测参与人1的选择。如果1选择R,则2选择选择L’或R’,其中L’使博弈结束,两人的收益均为1;3.参与人1观察2的

6、选择(并且回忆自己在第一阶段的选择),如果前两阶段的选择分别是R和R’,则1可选择L’’或R’’,每一选择都将结束博弈,选择L’’是参与人1的收益为3,参与人2的收益为0;选择R’’时,1的收益是0,2的收益是2。2009-03-09张醒洲大连理工10后向归纳法内在的理性假定:一个两个人的三阶段博弈计算后向归纳结果第1步参与人1会在博弈的第三阶段选择L”2009-03-09张醒洲大连理工11后向归纳法内在的理性假定:一个两个人的三阶段博弈第2步参与人2在第二阶段选择L’。2009-03-09张醒洲大连理工12后向归纳法内在的理性假定:一个两个人的三阶段博弈第3步参与人1在第一阶段作出最优反应选

7、择L后向归纳结果是(L,nothing,nothing)2009-03-09张醒洲大连理工13后向归纳法内在的理性假定:一个两个人的三阶段博弈理性和预测P1是理性的,P2是理性的。(L,N,N);(2,0)P1是非理性的,P2是理性的。(R,R’,R”);(0,2)P1是理性的,P2是非理性的。(R,R’,L”);(3,0)P1是非理性的,P2是非理性的。(R’,L’,N);(1,1)为什么??思

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。