《运筹学教程》胡云权 第五版 运筹学--6对策论--矩阵对策

《运筹学教程》胡云权 第五版 运筹学--6对策论--矩阵对策

ID:20476398

大小:1.26 MB

页数:33页

时间:2018-10-13

《运筹学教程》胡云权 第五版 运筹学--6对策论--矩阵对策_第1页
《运筹学教程》胡云权 第五版 运筹学--6对策论--矩阵对策_第2页
《运筹学教程》胡云权 第五版 运筹学--6对策论--矩阵对策_第3页
《运筹学教程》胡云权 第五版 运筹学--6对策论--矩阵对策_第4页
《运筹学教程》胡云权 第五版 运筹学--6对策论--矩阵对策_第5页
资源描述:

《《运筹学教程》胡云权 第五版 运筹学--6对策论--矩阵对策》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第六章对策论基本概念对策论又称博弈论,研究冲突对抗条件下最优决策问题的理论。策略形势:不完全竞争条件下的对抗行为,各方收益由自身行为和其他方行为共同决定。基本要素局中人(I):有权决定自己行动方案的对策参加者,理性人策略集(S):供局中人选择的实际可行完整行动方案的集合,一局对策中,各局中人选定策略的集合,称局势赢得函数(H(s)):对于任一局势,局中人的赢得值。支付函数严格占优策略/严格劣势策略上策均衡/纳什均衡典型案例和重要结论结论1:不要选择严格劣势策略。结论2:个人理性选择导致非最优。结论3:学会换

2、位思考。囚徒困境智猪博弈求解方法:删除严格劣势策略矩阵对策的基本理论局中人个数:二个,多个策略集中的个数:有限,无限支付/赢得代数和:零和,非零和局中人是否合作:非合作,合作局中人行动时间:静态,动态局中人对他者信息了解程度:完全信息,非完全信息对策次数:单次,重复对策/博弈分类课程目标理解并掌握矩阵对策的纯策略理解并掌握矩阵对策的混合策略掌握矩阵对策的求解方法矩阵对策的策略纯策略:确定的选择某策略混合策略:以某一概率分布选择各策略。矩阵对策的纯策略Ⅰ的赢得矩阵或Ⅱ的支付矩阵Ⅱ的赢得矩阵为-A。1、矩阵对策

3、的一般表达矩阵对策的纯策略例:田忌赛马局中人:田忌(I)、齐王(II)S1={(上、中、下),(上、下、中),(中、上、下),(中、下、上),(下、中、上),(下、上、中)}=S21、矩阵对策的一般表达矩阵对策的纯策略-82-10-3926理智行为:从各自最不利情形中选择最有利I:最大最小原则II:最小最大原则平衡局势:双方均可接受,且对双方都是最稳妥的结果。(α2,β2),局中人I和II的最优纯策略。2、矩阵对策解的引例矩阵对策的纯策略从上例看出,矩阵A中平衡局势(α2,β2)对应的元素a22既是其所在行

4、的最小元素,也是其所在列的最大元素,即有ai2≤a22≤a2ji=1,2,3,4j=1,2,33、矩阵对策的最优纯策略矩阵对策的纯策略123137463、矩阵对策的最优纯策略矩阵对策的纯策略对于一个对策G={S1,S2,A},若有则称局势(αi*,βj*)为对策G的鞍点,V=ai*j*为对策G的值。注:在矩阵中,一个数在所在行中是最大值,在所在列中是最小值,则被称为鞍点。4、矩阵对策的鞍点与解矩阵对策的纯策略多鞍点与无鞍点对策例:设有一矩阵对策如下,求它的解。局势(α1,β2),(α1,β4),(α3,β2

5、)(α3,β4)均构成鞍点,此对策有多个解。4、矩阵对策的鞍点与解矩阵对策的纯策略性质1:无差别性若(αi1,βj1)和(αi2,βj2)是对策G的两个解,则ai1j1=ai2j2性质2:可交换性若(αi1,βj1)和(αi2,βj2)是对策G的两个解,则(αi1,βj2)和(αi2,βj1)也是对策G的两个解。矩阵对策的值唯一。即当一个局中人选择了最优纯策略后,他的赢得值不依赖于对方的纯策略。5、矩阵对策纯策略的性质作业P385习题12.212.312.4矩阵对策的混合策略3456无鞍点1、混合策略矩阵对

6、策的混合策略1、混合策略矩阵对策的混合策略2、混合局势3、赢得期望4、混合策略对策模型矩阵对策的混合策略5、最优混合策略设,是矩阵对策的混合扩充。矩阵对策的混合策略5、最优混合策略矩阵对策的混合策略定理2:矩阵对策G在混合策略意义下有解的充要条件是:存在,使得对于任意,有2、最优混合策略矩阵对策的混合策略3、最优混合策略解的引例矩阵对策的解法例:求解矩阵对策G=,其中解:(1)不存在鞍点,为混合策略求解问题。(2)图解法求解设局中人I的混合策略为(x,1-x)T,。01IIIIII①数轴上坐标为0和1的两点

7、分别做两条垂线I-I和II-II。②画出局中人II的不同策略下局中人I的赢得线段。2572311β1=2x+7(1-x)β2=3x+5(1-x)β3=11x+2(1-x)图解法仅适用于赢得矩阵为2×n或m×2阶的矩阵对策问题。β1:v11=2x+7(1-x)β2:v12=3x+5(1-x)β3:v13=11x+2(1-x)③由于局中人II理性,局中人I从最少可能收入中选择最大的一个,为局中人I的最优对策。B2④求解方程组可得最优混合策略和矩阵对策的值。图解法01IIIIII2572311β1=2x+7(1-

8、x)β2=3x+5(1-x)β3=11x+2(1-x)B1B2B3B4联立过B2点两条直线的方程组为可解得则,局中人I的最优策略为由图可见局中人II的混合策略只有β2和β3组成。设局中人II的最优混合策略为,且P365例10图解法⑤求局中人II的最优混合策略。同理,可得局中人II的赢得,α1:v21=3y2+11y3α2:v22=5y2+2y3画出赢得线段,见右图01yy*3α11152α2局中人I理性,局中人I

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。