博弈讲稿1_2.ppt

博弈讲稿1_2.ppt

ID:48689256

大小:162.50 KB

页数:27页

时间:2020-01-19

博弈讲稿1_2.ppt_第1页
博弈讲稿1_2.ppt_第2页
博弈讲稿1_2.ppt_第3页
博弈讲稿1_2.ppt_第4页
博弈讲稿1_2.ppt_第5页
资源描述:

《博弈讲稿1_2.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第一章引论§1.1长街上的超市§1.2共同投资问题§1.3什么是博弈论博弈论:就是关于包含相互依存情况中理性行为的研究。相互依存:通常是指博弈中的任何一个局中人受到其他局中人的行为的影响,反过来,他的行为也影响到其他局中人相互依存的另一个方面是局中人可以有某些共同的兴趣或利益所在。“理性行为”的说明:博弈论中的所谓理性,一般不是指道德标准。由于局中人的相互依存性,博弈中一个理性的决策必定建立在预测其它局中人的反应之上。一个局中人将自己置身于其它局中人的位置并为他着想从而预测其它局中人将选择的行动,在这个基础上该局中

2、人决定自己最理想的行动,这就是博弈论方法的本质与精髓。盈利函数(payofffunction)博弈的三个要素:1.局中人以i=1,2,…,表示2.每个局中人一般有若干个策略(strategies)可供选择,它们构成了该局中人的纯策略空间。局中人i的纯策略空间用Si表示,倘若Si由ki个纯策略构成,则有Si=(si1,si2,…,sik)。纯策略空间有时也可以是连续的,比如在AB线段的海滩上摊位的选择就可认为几乎是连续的。3.每个局中人的盈利函数。我们记局中人i的盈利函数为ui(s),其中s=(s1,…,sy),而s

3、j表示局中人j所取策略,s表示r个局中人的策略向量。显然,盈利函数ui(s)与s有密切关系。它是每个局中人真正关心的东西。博弈的四种情况完全信息静态博弈完全信息动态博弈不完全信息静态博弈不完全信息动态博弈第一部分完全信息静态博奕第二章策略型博奕与Nash均衡§2∙1两人零和博奕——猜谜局中人212局中人111,-1-1,12-1,11,-1定义2.1:n人博弈的正则型(或策略型)表示指定了n个局中人以及他们各自的纯策略空间S1,S2,…,Sn和这些局中人各自得到盈利函数u1,u2,…,un。我们将该博弈表示为:G=

4、{S1,S2,…,Sn;u1,u2,…,un}§2.2混合策略局中人2若出示1,期望盈利为–p–(1–p)=1–2p0局中人2若出示2,期望盈利为p–(1–p)=2p–10局中人i(i=1,2,…,I)的一个混合策略是该局中人的纯策略空间Si=(Si1,Si2,…,Siki)(Si共有ki个纯策略)上的概率分布,以数学符号σi来表示。所有I个局中人各自采取的混合策略σ1,σ2,…,σI是统计独立的。例2.1二人博弈的盈利矩阵如下:局中人2LMRU局中人1MD4,35,16,22,18,43,63,09,62,8

5、§2.3累次严优(iteratedstrictdominance)局中人2LR局中人1UMD4,36,22,13,63,02,8每一个局中人舍弃自己的劣策略或条件劣策略的做法从逻辑上说是令人信服的。从某一个局中人的角度出发排除该局中人的劣策略,然后在“缩小了的”“条件”博弈中,从另一个局中人角度出发,剔除此人的劣策略,这样一步一步地进行下去,除非到某一步不存在所谓的劣策略,否则可以一直剔除下去,最后幸存下来的结局合乎逻辑地成为博弈的预测结局。我们称这个过程为累次取优(iterateddominance),更精确地,

6、应称为累次严优(iteratedstrictdominance)。累次严优法对于预测博弈的合理结局是有局限性的。累次剔除劣策略过程先从局中人1开始与先从局中人2的角度出发其最后结果是否一样?面临的问题是在纯策略之间无优劣之分时,是否可以考虑混合策略的优劣,或者问混合策略是否有严劣策略之说,累次严优解的范围窄小常常使得它成为博弈问题的“理想”预测,但是在这里,我们想指出有时候理想的事情未必在实际生活中行得通。尤其是在盈利函数取极端值时会出现“反常”现象。局中人2LR局中人1UD7,9-1000,8.56,55,4.5

7、定义2.2:定义2.2对于局中人i的(混合)策略空间∑i中的某个纯策略si,如果存在混合策略σi*∈∑i使得Ui(σi*,s-i)≥Ui(si,s-i)对任意s-i∈S-i成立,且在S-i中至少存在一个纯策略组合s-i*∈S-i,使(2.9)式中的不等号严格成立Ui(σi*,s-i*)>Ui(si,s-i*)则称纯策略si为局中人i的弱劣纯策略;倘若对一切s-i∈S-i,(2.9)中的不等式都严格地成立:Ui(σi*,s-i)>Ui(si,s-i)s-i∈S-i则称si为局中人i的严劣纯策略。纯策略劣于混合策略的

8、现象局中人2LRU局中人1MD2,0-1,00,00,0-1,02,0囚徒窘境(Prisoner’sDilemma)乙坦白抗拒甲坦白抗拒-8,-80,-15-15,0-1,-1智猪博弈大猪踩不踩小猪踩不踩1.5,3.5-0.5,65,0.50,0Nash均衡Nash均衡因数学家Nash而命名,Nash均衡策略是指这样的策略组合(或剖面),为了极大化自己的盈利

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。