资源描述:
《《对策与决策模型》ppt课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第八章对策与决策模型浙江大学数学建模基地第八章对策与决策模型对策与决策是人们生活和工作中经常会遇到的择优活动。人们在处理一个问题时,往往会面临几种情况,同时又存在几种可行方案可供选择,要求根据自己的行动目的选定一种方案,以期获得最佳的结果。有时,人们面临的问题具有竞争性质,如商业上的竞争、体育中的比赛和军事行动、政治派别的斗争等等。这时竞争双方或各方都要发挥自己的优势,使己方获得最好结果。因而双方或各方都要根据不同情况、不同对手做出自己的决择,此时的决策称为对策。在有些情况下,如果我们把可能出现的若干种情况也看作是竞争对手可采取的几种策略,那么也可以把决策问题当作对策问题来求解。§
2、8.1对策问题对策问题的特征是参与者为利益相互冲突的各方,其结局不取决于其中任意一方的努力而是各方所采取的策略的综合结果。先考察几个实际例子。例8.1(田忌赛马)田忌赛马是大多数人都熟知的故事,传说战国时期齐王欲与大将田忌赛马,双方约定每人挑选上、中、下三个等级的马各一匹进行比赛,每局赌金为一千金。齐王同等级的马均比田忌的马略胜一筹,似乎必胜无疑。田忌的朋友孙膑给他出了一个主意,让他用下等马比齐王的上等马,上等马对齐王的中等马,中等马对齐王的下等马,结果田忌二胜一败,反而赢了一千金。例8.2(石头—剪子—布)这是一个大多数人小时候都玩过的游戏。游戏双方只能选石头、剪子、布中的一种,
3、石头赢剪子,剪子赢布,而布又赢石头,赢者得一分,输者失一分,双方相同时不得分,见下表。表8.1石头剪子布石头01-1剪子-101布1-10例8.3(囚犯的困惑)警察同时逮捕了两人并分开关押,逮捕的原因是他们持有大量伪币,警方怀疑他们伪造钱币,但没有找到充分证据,希望他们能自己供认,这两个人都知道:如果他们双方都不供认,将被以使用和持有大量伪币罪被各判刑18个月;如果双方都供认伪造了钱币,将各被判刑3年;如果一方供认另一方不供认,则供认方将被从宽处理而免刑,但另一方面将被判刑7年。将嫌疑犯A、B被判刑的几种可能情况列表如下:表8.2嫌疑犯B供认不供认嫌疑犯A供认不供认(3,3)(0,
4、7)(7,0)(1.5,1.5)表中每对数字表示嫌疑犯A、B被判刑的年数。如果两名疑犯均担心对方供认并希望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。一、对策的基本要素(1)局中人。参加决策的各方被称为决策问题的局中人,一个决策总是可以包含两名局中人(如棋类比赛、人与大自然作斗争等),也可以包含多于两名局中人(如大多数商业中的竞争、政治派别间的斗争)。局中人必须要拥用可供其选择并影响最终结局的策略,在例8.3中,局中人是A、B两名疑犯,警方不是局中人。两名疑犯最终如何判刑取决于他们各自采取的态度,警方不能为他们做出选择。从这些简单实例中可以看出对策现象中包含的几个基本要素。(
5、2)策略集合。局中人能采取的可行方案称为策略,每一局中人可采取的全部策略称为此局中人的策略集合。对策问题中,对应于每一局中人存在着一个策略集合,而每一策略集合中至少要有两个策略,否则该局中人可从此对策问题中删去,因为对他来讲,不存在选择策略的余地。应当注意的是,所谓策略是指在整个竞争过程中对付他方的完整方法,并非指竞争过程中某步所采取的具体局部办法。例如下棋中的某步只能看和一个完整策略的组成部分,而不能看成一个完整的策略。当然,有时可将它看成一个多阶段对策中的子对策。策略集合可以是有限集也可以是无限集。策略集为有限集时称为有限对策,否则称为无限对策。记局中人i的策略集合为Si。当对
6、策问题各方都从各自的策略集合中选定了一个策略后,各方采取的策略全体可用一矢量S表示,称之为一个纯局势(简称局势)。例如,若一对策中包含A、B两名局中人,其策略集合分别为SA={1,…,m},SB={1,…,n}。若A选择策略i而B选策略j,则(i,j)就构成此对策的一个纯局势。显然,SA与SB一共可构成m×n个纯局势,它们构成表8.3。对策问题的全体纯局势构成的集合S称为此对策问题的局势集合。(m,n)…(m,j)…(m,2)(m,1)m…………………(i,n)…(i,j)…(i,2)(i,1)i…………………(2,n)…(2,j)…(2,2)(2,1)2(1,n)…(1,j)…(
7、1,2)(1,1)1A的策略n…J…21B的策略(3)赢得函数(或称支付函数)。对策的结果用矢量表示,称之为赢得函数。赢得函数F为定义在局势集合S上的矢值函数,对于S中的每一纯局势S,F(S)指出了每一局中人在此对策结果下应赢得(或支付)的值。综上所述,一个对策模型由局中人、策略集合和赢得函数三部分组成。记局中人集合为I={1,…,k},对每一i∈I,有一策略集合Si,当I中每一局中人i选定策略后得一个局势s;将s代入赢得函数F,即得一矢量F(s)=(F1(s),…,