欢迎来到天天文库
浏览记录
ID:48493661
大小:1.70 MB
页数:80页
时间:2020-01-22
《M11博弈模型.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第十一章博弈模型11.1进攻与撤退的抉择11.2让报童订购更多的报纸11.3“一口价”的战略11.4不患寡而患不均11.5效益的合理分配11.6加权投票中权力的度量单一决策主体决策变量目标函数约束条件决策主体的决策行为发生直接相互作用(相互影响)博弈模型非合作博弈合作博弈三要素博弈模型(GameTheory)多个决策主体优化模型(Optimization)决策问题(DecisionProblem)静态、动态信息完全、不完全军事、政治、经济、企业管理和社会科学中应用广泛1944年6月初,盟军在诺曼底登陆成功.到8月初的形势:背景11.1进攻与撤退的抉择双方应该如何决策?
2、强化缺口盟军(预备队)撤退进攻德军盟军(加)盟军(英)盟军(美一)盟军(美三)东进原地待命模型假设博弈参与者为两方(盟军和德军)盟军有3种使用其预备队的行动:强化缺口,原地待命,东进;德军有2种行动:向西进攻或向东撤退.博弈双方完全理性,目的都是使战斗中己方获得的净胜场次(胜利场次减去失败场次)尽可能多.盟军胜1场盟军败2场东进无战斗盟军胜2场原地待命无战斗盟军胜1场强化缺口向东撤退向西进攻盟军德军完全信息静态博弈共同知识(以上信息双方共有)双方同时做出决策博弈模型博弈参与者集合N={1,2}(1为盟军,2为德军)用u1(a1,a2)表示对盟军产生的结果,即净胜场次,
3、称为盟军的效用函数.盟军胜1场盟军败2场东进无战斗盟军胜2场原地待命无战斗盟军胜1场强化缺口向东撤退向西进攻盟军德军盟军行动a1A1={1,2,3}(强化缺口/原地待命/东进);德军行动a2A2={1,2}(进攻/撤退)。(行动:即纯战略)支付矩阵(PayoffMatrix)完全竞争:零和博弈(常数和博弈)u2(a1,a2)对应-M博弈的解的概念:纳什均衡(NE:NashEquilibrium)不存在(纯)NE(纯战略)纳什均衡Nash:1994年获诺贝尔经济学奖NE:单向改变战略不能提高自己效用,即每一方的战略对于他方的战略而言都是最优的,称为最优反应.(纯)NE:
4、a*=(a1*,a2*)=(2,2)非常数和博弈(双矩阵表示)混合战略(策略:Strategy)盟军的混合战略集期望收益盟军德军S1={p=(p1,p2,p3)
5、}德军的混合战略集S2={q=(q1,q2)
6、}完全信息 静态博弈有限博弈 矩阵博弈(2人)零和博弈常数和博弈模型求解理性推理:不管自己怎么做,另一方总是希望尽量使自己得分尽量低.(二人零和博弈,完全竞争)盟军德军线性规划从一个给定的战略中期望得到的赢得,总是采用该策略时他们可能得到的最坏的赢得!盟军可以用minpM来衡量策略p的好坏maxU1(p)=minpMminU2(q)=maxMqT德军可以用maxM
7、qT来衡量策略q的好坏(p*,q*):混合(策略)纳什均衡(MixedNE)p2*=3/5,p3*=2/5q1*=1/5,q2*=4/5最优值均为2/5占优(dominate):盟军的行动2占优于1(前面的非常数和博弈M’类似)混合策略似乎不太可行!但概率可作为参考.----现实:盟军让预备队原地待命(行动2),而德军没有选择撤退(行动2),结果德军大败.模型评述博弈规则至关重要的,如参与人决策的时间顺序、决策时拥有哪些信息等.多人(或非常数和)博弈问题,一般不能用上面的线性规划方法求解,而通过纳什均衡的定义求解.小结:博弈模型的基本要素参与人理性假设行动顺序(静态、
8、动态)信息结构(完全、不完全)行动空间(及战略空间)效用函数参与者完全理性(最大化效用)其他因素纳什均衡单向改变战略不能提高自己效用11.2让报童订购更多的报纸报童模型回顾订购价w,零售价p,处理价v(p>w>v>0)需求量:密度函数f(x)、分布函数F(x),F(0)=0订购Q份报纸,期望销售量为期望存货量期望利润最优订购量QrQr(w)11.2让报童订购更多的报纸问题假设报社报纸成本价为c,w≥c>vw*完全信息动态博弈:常称StackelbergGame(两阶段)子博弈完美均衡:(w*,Qr(w))一般w*>cQr(w*)9、调)?假设报社与报童联合,整体利润最大价格折扣协议模型折扣方案wd(Q)下,报童效用(期望利润)达到协调假设报社与报童联合,整体期望利润关于Q的减函数(非线性)λ↑,报童利润↑,报社利润↓利润的任意分配比例都可达到模型一回收价格协议原订货量达到协调整体最优b↑,报童利润↓,报社利润↑利润的任意分配比例都可达到回收价b(p>w>b>v)回收协议模型模型二回收数量协议报社回收达到协调报童回收α↑,报童利润↓,报社利润↑;利润任意分配都可达到按批发价回收,比例为α报童利润回收协议模型模型评述协议参数的确定:不能单方决定双方谈判(合作博弈)还有很多其他类型的
9、调)?假设报社与报童联合,整体利润最大价格折扣协议模型折扣方案wd(Q)下,报童效用(期望利润)达到协调假设报社与报童联合,整体期望利润关于Q的减函数(非线性)λ↑,报童利润↑,报社利润↓利润的任意分配比例都可达到模型一回收价格协议原订货量达到协调整体最优b↑,报童利润↓,报社利润↑利润的任意分配比例都可达到回收价b(p>w>b>v)回收协议模型模型二回收数量协议报社回收达到协调报童回收α↑,报童利润↓,报社利润↑;利润任意分配都可达到按批发价回收,比例为α报童利润回收协议模型模型评述协议参数的确定:不能单方决定双方谈判(合作博弈)还有很多其他类型的
此文档下载收益归作者所有