对策论建模练习题

对策论建模练习题

ID:43793861

大小:39.00 KB

页数:3页

时间:2019-10-14

对策论建模练习题_第1页
对策论建模练习题_第2页
对策论建模练习题_第3页
资源描述:

《对策论建模练习题》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、对策论建模练习题1.对策论对称对策的概念若一个对策冇两个局中人,每人轮流走一着,月.两个局中人而临同一局势时所能采用的着完金相同,规定谁碰到最终局势就谁输。这种对策称为对称对策。可以看到,彖棋不是对称对策。因为同一局势时,红方只能动红子,黑方只能动黑子。对称对策的实例可见例。先输局势与先胜局势我们可以把所有局势的集合分成先输局势与先胜局势。先输局势记为a,(包括所有的最终局势),意思是说,任何局中人遇到这种局势时,只要对方不犯错误,他就无法取胜。注意,所有的最终局势都是先输局势。先胜局势记为以,意思是说,先动手的局中人有必胜策略。先输局势与先胜局势的判断一般我们假设

2、一个对策的局势集是冇限的,这时我们可以利用下列办法确定一个对称对策的先输局势集和先胜局势集:若局势a皀Gi,则必存在着一着把3变为。•中的局势;若局势曲€纨,则任何一着都把丹变为纨屮的局势。实际上,若现在的局势8◎斜,那么先动手的人可以选择一着把它变为叭eS,而对方的任意一着都将把T变成®这样先行者又可以选择一着把叫这样循环下去,由于最终局势属于以,所以遇到最终局势的必是后行者,也就是说,先行者有必胜的策略。同理可知,若一局中人遇到先输局势,只要对方对应正确,该局中人必输。通过例可以具体说明这个判断原理。对称对策的实例。对称对策的游戏。对称对策的实例一堆棋子共20个

3、,甲、乙两人轮流从中取走棋子,每次可取1—4个,取完棋子者为胜。试研究对策的策略。对称对策的游戏有两堆棋子分别有20枚与16枚。两个局中人轮流从任意一堆取棋了。如果从第一堆取可取1-4枚,从第二堆取可取1—3枚,取完棋子者为胜。先输局势与先胜局势记第一堆数量为xl,第二堆数量为x2,那么先输局势fl0={(x,y)

4、x除以5的余数=y除以4的余数};先胜局势no={(x,y)

5、x除以5的余数打除以4的余数}二人零和有限对策的概念二人零和冇限对策也叫矩阵对策。在这种对策中,只冇两个局中人,每个局屮人各冇冇限个可供选择的策略。在每个对局屮,两个局屮人独立的选择一个策略(

6、互相都不知道对方的策略),而两人的收益总和为零。这种对策中,两个局屮人的利益是完全相反的,因此不存在合作的可能。二人零和有限对策的表示用I、II表示两个局中人,局中人I有m个策略:al,a2,…,am,局中人II有n个策略:pl,卩2,…,卩n。当I选取策略ai,II选取策略0j,就形成一个局势(ai,pj),这时局中人I的收益为aij,局屮人II的收益为・aij。矩阵A=(aij)称为局中人I的收益矩阵。显然矩阵(aij)完全确定了这个对策。二人零和有限对策的求解设局中人I、II都釆用保守准则,保证最小收益。即maxmin准则。那么对局中人I來说,他应对口己每一种

7、可以选择的策略求出其最小的收益,再选择最小收益最大的那个策略。对收益矩阵A=(aij)来说,就是先从每一行中求最小值,再在这些最小值中选出最大值。即maximinjaijo对局中人II來说,A是他的损失矩阵,他的收益是・aij,所以他对A使用保守准则时,应当先在每一列中求出最大值,再在这些最大值中选择最小的那个,即minjinaxiaij。请参看例1来加以理解。鞍点设对策G的收益矩阵为A,若maximinjaij=minjmaxjaij,且等于矩阵元素ai*j*,那么(i*,j*)称为对策G的一个鞍点,ai*称为局中人I的最优纯策略,

8、3j*称为局中人II的最优纯策

9、略,VG=ai*j*称为对策G的值。二人零和有限对策实例例1设冇一矩阵对策,局屮人I的收益矩阵为-6I-8'3249-I-10-306■试研究双方策略。博弈论的概念I■専弈论是研究决策主体的行为发主直接相互作用时候的决策以及这种决策的均衡问题的,也就是说,当一个主体,比如一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过來影响到具他人、其他企业选择时的决策问题和均衡问题。博弈论的基本要素参与人:指博弈屮通过选择行动以使自己效用最大化的决策主体(可能是人,也可能是团体,如国家、企业等);行动:是参与人在决策时的变量战略:是参与人选择行动的规则,它告诉参与人

10、在什么时候选择什么行动。(如“人不犯我,我不犯人;人若犯我,我必犯人”是一种战略,这里,“犯''与“不犯”是两种不同的行动,战略规定了什么时候选择“犯匕什么时候选择“不犯");其中,在一些特殊的I■専弈中,一个参与人的最优战略可能不以来于其他参与人的战略选择,就是说,不论其他参与人选择什么战略,他的最优战略是唯一的,这样的战略称为“占优战略"。“占优战略,河见例1。信息:指参与人在博弈中的知识,特别是冇关其他参与人(对手)的特征和行动的知识;支付函数:参与人从博弈中获得的效用水平,它是所冇参与人战略或行动的函数,是每个参与人真正关心的东西;均衡:所有参与人的最优

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。