【精品】1对策论的基本概念

【精品】1对策论的基本概念

ID:44588369

大小:164.43 KB

页数:8页

时间:2019-10-23

【精品】1对策论的基本概念_第1页
【精品】1对策论的基本概念_第2页
【精品】1对策论的基本概念_第3页
【精品】1对策论的基本概念_第4页
【精品】1对策论的基本概念_第5页
资源描述:

《【精品】1对策论的基本概念》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、§1对策论的基本概念对策模型的三个基本要素:1•局中人:参与对抗的各方;2•策略集:局中人选择对付其它局中人的行动方案称为策略;某局中人的所有可能策略全体称为策略集;3•—局势对策的益损值:局中人各自使用一个对策就形成了一个局势,一个局势决定了各局中人的对策结果(量化)称为该局势对策的益损值。“齐王赛马”齐王在各局势中的益损值表(单位:千金)§1对策论的基本槪念其中:齐王的策略集:Si={ai,a2,a3,a4,a§,a6}9田忌的策略集:S2二{卩1,卩2,卩3,卩4,卩5,卩6}。F面矩阵称齐王的赢得矩阵:3111-11131

2、11-1A=1-13-111311111-13111-1113§1对策论的基本概念二人有限零和对策(又称矩阵对策):局中人为2;每个局中人的策略集的策略数目都是有限的;每一局势的对策均有确定的损益值,并且对同一局势的两个局中人的益损值之和为零。通常将矩阵对策记为:G二{Si,S2,A}S1:甲的策略集;s2:乙的策略集;A:甲的赢得矩阵。“齐王赛马"是一个矩阵策略。§2矩阵对策的最优纯策略在甲方的赢得矩阵中:A=[

3、j,这一局势下甲方的益损值。此时乙方的益损值为-旳(零和性质)。在考虑各方采用的策略时,必须注意一个前提,就是双方都是理智的,即双方都是从各自可能出现的最不利的情形选择一种最为有利的情况作为决策的依据。§2矩阵对策的最优纯策略例:甲乙乒乓球队进行团体对抗赛,每队由三名球员组成,双方都可排成三种不同的阵容,每一种阵容可以看作一种策略,双方各选一种策略参赛。比赛共赛三局,规定每局胜者得1分,输者得-1分,可知三赛三胜得3分,三赛二胜得1分,三赛一胜得-1分,三赛三负得-3分。甲队的策略集为Si={ai,a2,a3},乙队的策略集为S2

4、={pi,p2,加}。根据以往比赛的资料,有甲队的赢得矩阵为A,如下所示,请问这次比赛各队采用哪种阵容上场最为稳妥?§2矩阵对策的最优纯策略矩阵A中每行的最小元素分别为1,-3,-lo在这些最少赢得中最好的结果是1,故甲队会采取策略%,无论对手采取何策略,甲队至少得1分。对于乙队,{pi,p2,卩3}可能带来的最少赢得,即A中每列的最大元素,分别为3,1,3o乙队会采取卩2策略,确保甲队不会超过1分。e和比分别称为局中人甲队、乙队的最优策略。由于双方必然选择这一种策略,所以,这种策略又称为最优纯策略。这种最优纯策略只有当赢得矩阵A

5、二3门)中等式成立时,双方才有最优纯策略,并把(abp2)称为对策G在纯策略下的解,又称(ai,p2)为对策G的鞍点。把其值V称之为对策G={Si,S2,A}的值。§2矩阵对策的最优纯巢略例某单位采购员在秋天决定冬季取暖用煤的储量问题,已知在正常的冬季气温条件下要消耗15吨煤,在较暖和较冷的天气下要消耗10吨和20吨。假定冬天的煤价随天气寒冷程度而有所变化,在较暖和、正常、较冷的气候条件下每吨煤价分别为10元、15元、20元。又设冬季时煤炭价格为每吨10元。在没有关于当年冬季准确的气象预报的条件下,秋天储煤多少吨能使得单位的支出最

6、少?解:局中人I为采购员,局中人II为大自然,釆购员有三个策略,买10吨、15吨、20吨。分别记为a2,a:.o大自然也有三个策略:暖、正常、冷,分别记为肌,比,p3o§2矩阵对策的最优纯策略赢得矩阵如下:在此表上计算,有得故(a3,卩:Q为对策G的解,Vg=-200o设矩阵对策G二{Si,S2,A}。当maxmin工minmax呦时,不存在最优纯策略。例:设一个赢得矩阵如下:min595A=max6866imax89min8策略卩i当甲取策略(X2,乙取策略血时,甲实际赢得8比预期的多2,乙当然不满意。考虑到甲可能取策略g这一点

7、,乙采取策略血。若甲也分析到乙可能采取策略血这一点,取策略ou则贏得更多为9…。此时,对两个局中人甲、乙来说,没有一个双方均可接受的平衡局势,其主要原因是甲和乙没有执行上述原则的共同基础,即maxmin呦工minmaxayo一个自然的想法:对甲(乙)给出一个选取不同策略的概率分布,以使甲(乙)在各种情况下的平均赢得(损失)最多(最少)——即混合策略。求解混合策略的问题有图解法、迭代法、线性方程法和线性规划法等,我们这里只介绍线性规划法,其他方法略。例:设甲使用策略e的概率为X「,使用策略a?的概率为X2',并设在最坏的情况下,甲赢

8、得的平均值为V(未知)。59A=STEP1861)Xj+x2=1Xi,x2>02)无论乙取何策略,甲的平均赢得应不少于V:对乙取內:5X「+8X2*>V对乙取卩2:9X/+6X2*>V注意V>0,因为A各元素为正。STEP2作变换:Xi=x;/v;

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。