资源描述:
《博弈论和其应用-课节4》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、19教案5――第二章完全信息静态博弈教案4教学题目:(第二章完全信息静态博弈,§2-§3)学时数2教学目的和要求:理解Nash均衡的表达。掌握Nash均衡的应用。教学基本内容:基本方法:理解Nash均衡的表达。掌握Nash均衡的应用。教学重点与难点:重点在于Nash均衡的应用;难点在于例2.6的讨论。教学过程:1.课前复习理解博弈均衡的概念。2.讲授新课:§2.2Nash均衡我们再以囚徒困境为例讨论如下:囚徒B坦白囚徒B抗拒囚徒A坦白-6,-60,-10囚徒A抗拒-10,0-1,-119教案5――第二章完全信息
2、静态博弈显然,不论囚徒A选择坦白还是抗拒,囚徒B的最优策略都是坦白;不论囚徒B选择坦白还是抗拒,囚徒A的最优策略都是坦白;由收益函数:(抗拒,坦白)=-10;(坦白,坦白)=-6;(抗拒,抗拒)=-1;(坦白,抗拒)=0。(抗拒,坦白)=0;(坦白,坦白)=-6;(抗拒,抗拒)=-1;(坦白,抗拒)=-10。(坦白,⊙)>(抗拒,⊙);(⊙,坦白)>(⊙,抗拒);这时,“坦白”策略就成为囚徒A,B的严格优策略,如果一个博弈中的所有局中人都存在严格优策略,那么由这些严格优策略组成的局势,就是该博弈的惟一均衡解。在
3、囚徒困境中的囚徒A,B的严格优策略“坦白”组成的局势(坦白,坦白)就是该博弈的惟一均衡解。记,则局势。定义2-2(严格优策略)在n人博弈中,除局中人外,其余n-1个局中人的所有可能的局势,局中人存在着一个自己的策略,使得对一切的,有,则称是局中人的严格优策略。19教案5――第二章完全信息静态博弈囚徒A,B在囚徒困境中都有自己的严格优策略“坦白”,组成的局势(坦白,坦白)为该博弈的惟一均衡解。这种现象是一般规律吗?命题2-1在n人博弈中,如果每一个局中人都有自己的严格优策略,那么,n个局中人每人的严格优策略组成的
4、局势是博弈的惟一均衡解,并称为严格优策略均衡局势或严格优策略均衡解。证明:由以上的讨论,n个局中人的严格优策略组成的局势是博弈的一个均衡解。如果博弈有两个均衡解,则至少有一个局中人有两个严格优策略,设,.因为是局中人的严格优策略,所以(1);又因为也是局中人的严格优策略,所以(2).结合(1)(2)两式有:,此为矛盾.因此,.从而,,即解是唯一的.□定义2-4(优策略)在n人博弈中,除局中人19教案5――第二章完全信息静态博弈外,其余n-1个局中人的所有可能的局势,局中人存在着一个自己的策略,使得对一切的,有,
5、并且,局中人至少存在着一个自己的策略,使得,则称是局中人的优策略。显然,严格优策略一定是优策略.但在许多情况下,不要说严格优策略,就是优策略都未必存在!我们以例2-1(猎鹿博弈)为例讨论如下:猎人B-猎鹿猎人B-猎兔猎人A-猎鹿10,100,1猎人A-猎兔1,01,1由收益函数:(猎鹿,猎鹿)=10;(猎兔,猎鹿)=1;(猎鹿,猎兔)=0;(猎兔,猎兔)=1。(猎鹿,猎鹿)=10;(猎兔,猎鹿)=1;(猎鹿,猎兔)=0;(猎兔,猎兔)=1。但是,(猎鹿,⊙)>(猎兔,⊙)不成立,因为(猎鹿,猎鹿)=10>(猎兔
6、,猎鹿)=1;(猎鹿,猎兔)=0<(猎兔,猎兔)=1;19教案5――第二章完全信息静态博弈因此,猎人A没有优策略,更没有严格优策略。对猎人B的讨论也同样没有优策略。但却存在两个Nash均衡解。博弈解的第一组值为(10,10)(双值),对应博弈的解为(猎鹿,猎鹿);博弈解的第二组值为(1,1)(双值),对应博弈的解为(猎兔,猎兔),它们都是Nash均衡,即此博弈有2个解,或两个均衡点。问题是:这两个解应当如何去看?如果将博弈改为猎人乙-猎鹿猎人乙-猎兔猎人甲-猎鹿10,100,1猎人甲-猎兔1,00,0请同学们发
7、表意见。毛泽东的思考由收益函数:(猎鹿,猎鹿)=10;(猎兔,猎鹿)=0;(猎鹿,猎兔)=1;(猎兔,猎兔)=0。(猎鹿,猎鹿)=10;(猎兔,猎鹿)=1;(猎鹿,猎兔)=0;(猎兔,猎兔)=0。显然,(猎鹿,⊙)>(猎兔,⊙)成立,因为(猎鹿,猎鹿)=10>(猎兔,猎鹿)=1;(猎鹿,猎兔)=1>(猎兔,猎兔)=0;因此,猎人A有严格劣策略“猎兔”;同理,猎人B也有严格劣策略“猎兔”。19教案5――第二章完全信息静态博弈我们在上述基本式中剔除严格劣策略,我们就只剩下一个均衡解:猎人B-猎鹿猎人A-猎鹿10,1
8、0我们为什么要割资本主义的尾巴?智猪博弈产生了,我的经历:猎鹿博弈智猪博弈囚徒困境例2-2斗鸡博弈首先,依据情景描述写出博弈的基本式:再列出博弈双方的收益矩阵(双矩阵)飞车党党徒B让飞车党党徒B撞飞车党党徒A让-10-10-10+10飞车党党徒A撞+10-10-∞-∞最后,用相对优势策略的划线法求解:19教案5――第二章完全信息静态博弈飞车党党徒B让飞车党党徒B撞飞车党党徒A让-10-